Научная статья на тему 'Z*sample - an application for sample size dermination'

Z*sample - an application for sample size dermination Текст научной статьи по специальности «Клиническая медицина»

CC BY
107
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
SAMPLE SIZE / SHINY

Аннотация научной статьи по клинической медицине, автор научной работы — Zlatev Stefan, Hadzhigaev Viktor, Todorov Rangel, Drumeva Svilena

Introduction: One of the major stages in research preparation is the determination of an appropriate sample size to answer the research question. Purpose: The current work presents an open source, internet based application for sample size determination, developed by the authors. Materials and Method: The application is written in “R” the functional computer language for statistical processing. The graphical interface is created with “Shiny”. Results and discussion: The application is hosted under the domain zlatev.science:3838/zsample/. The program has a menu with 3 divisions. The first one is “Instructions” and covers the usage as well as the formulas used for sample size determination. The second is “conventional effect size” based on Cohen’s suggestions. The third one is a drop down menu offering the user sample size determination for the two most frequently used statistical tests in the field of dentistry ANOVA and t-test. Conclusion: The usage of the proposed application is easy and intuitive.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Z*sample - an application for sample size dermination»

Научни трудове на Съюза на учените в България-Пловдив Серия Г. Медицина, фармация и дентална медицина т.ХХ1. ISSN 1311-9427 (Print), ISSN 2534-9392 (On-line). 2017. Scientific works of the Union of Scientists in Bulgaria-Plovdiv, series G. Medicine, Pharmacy and Dental medicine, Vol.XXI. ISSN 1311-9427 (Print), ISSN 2534-9392 (On-line). 2017.

Z*sample - АПЛИКАЦИЯ ЗА ИЗЧИСЛЯВАНЕ НА НЕОБХОДИМИЯ БРОЙ ЕДИНИЦИ НА НАБЛЮДЕНИЕ Стефан Златев1, Виктор Хаджигаев1, Рангел Тодоров2,

Свилена Друмева3

1Протетична дентална медицина, ФДМ, МУ Пловдив 2 Катедра протетична дентална медицина, ФДМ, МУ София 3 студент, ФДМ, МУ Пловдив

Z*sample - AN APPEICATION FOR SAMPLESIZE DERMINATION Stefan Zlatev1, Viktor Hadzhigaev1, Rangel Todorov2, iPilena Drumeva3

department eV j^i^oeT^^te: dentintrn, FDM, MU Plovdlv 2Departm ent of prosthetic dentistry, FDM, MU Sofia 3 st^ent, FDM, MU Plevdiv

Abstract

Introduction: One of the major stages in research preparation is the determination of an appropriate sample size to answer the research question. Purpose: The current work presents an open source, internet based application for sample size determination, developed by the authors. Materials and Method: The application is written in “R” - the functional computer language for statistical processing. The graphical interface is created with “Shiny”. Results and discussion: The application is hosted under the domain

zlatev.science:3838/zsample/. The program has a menu with 3 divisions. The first one is “Instructions” and covers the usage as well as the formulas used for sample size determination. The second is “conventional effect size” based on Cohen’s suggestions. The third one is a drop down menu offering the user sample size determination for the two most frequently used statistical tests in the field of dentistry - ANOVA and t-test. Conclusion: The usage of the proposed application is easy and intuitive.

Key words: sample size, R, Shiny

Въведение:

Определянето на необходимият брой единицы на наблюдение е един от най-важните етапи във всяко проучване. Изчисляването трябва да се извърши предварително, в етапа на планиране и зависи от дизайна на изследването. Правилното определяне на необходимия брой единици помага на изследователя да получи достоверни, базирани на доказателства резултати, спестява работа, време и средства на научния екип. (Dimitrov 1996; Dimitrov 2007; Lwanga S.K. & Lemeshow S. 1991) То е в пряка зависимост от структурата на данните получени от проучването, както и от статистическите тестове, конто ще бъдат използвани при анализа. Направената справка(Jain et al. n.d.; Krithikadatta & Valarmathi 2012; Ambrosano et al. 2004) показва, че методите най-често използвани в сферата на материалознанието са t тест с равни пропорции и OneWayANOVA анализ, като най-честият дизайн на проучванията е контрола - опитна група.

Изчисляването на необходимия брой единици на наблюдение може да се извърши ръчно, чрез различни формули или да се използва компютърна програма. „R“ представлява безплатна програмна среда за статистическа обработка и създаване на графики. Чрез създаването и модифицирането на „пакети“ всеки потребител може да разшири функционалността му, автоматизирайки рутинни задачи. Това го превръща в мощен инструмент, надминаващ възможностите на платформи като SPSS, STATA и др.. Пакетът Shiny , позволява създаването на графичен интерфейс, чрез който потребителят да използва възможностите на R, без да притежава познания по програмиране.

За изчисляване на необходимия брой единици на наблюдение е необходимо изследователя да разполага с данни, или да направи предположения за следните фактори:

1. Ниво на значимост - а (грешка от I тип : 1- а )

2. Размер на ефекта

3. Мощност на използвания критерии (грешка от II тип : 1- в )

Ако стойностите на горните са наличии, може да се изчисли четвъртият -брой единици на наблюдение, тъй като те са взаимосвързани. Връзката може да се изрази чрез уравнение 1, използвано за определяне на равенство между средните на две изследвани съвкупности (t тест с еднакви пропорции) (Binu et al. 2014) : _2(Za + Z1_p))g2

Където :

n - Необходим брой единици на наблюдение.

Za - Грешка от първи тип, стойностите и се вземат от таблица. (Dimitrov 1996)

Z1-p - Грешка от втори тип, зависи от мощността на изследването. (Ranchov 1997)

о - Стандартно отклонение - получава се от предходни изследвания или пилотно

изследване.

Д - Размер на ефекта - получава се от предходни изследвания или се приемат стандартни стойности

Стандартното отклонение може да се определи, като вариабилността на данните получени от извадката. За определянето му е необходимо, да се направи предварително пилотно проучване или да се използват литературни данни от експеримент със сходен дизайн. Когато предходните не са възможни, може да се използва предложената от Smith, Sc.

приблизителна стойност от 0.5 или да се вземе разликата между максималната и минималната стойности и да се раздели на 4 или 6 . И двата варианта предлагат близко до реалното стандартно отклонение, при извадки с нормално разпределение.

Размера на ефекта се дефинира, като големината на разликата от нулевата хипотеза, която може да се установи с даден статистически метод. Изчисляването на размера на ефекта при t тест с независими извадки, се прави чрез уравнение 2. (Gravetter 2013)

Mi — М2 разлика между средните аритметични

d =-------=------------------------------------ (2)

а стандартно отклонение

При OneWayANOVA анализ формулата за изчисляването му е значително по сложна - уравнение 3. Тя може да се разгледа като част от анализа за мощност на F. Чрез този тест се определя дали средните аритметични на сравняваните групи са равни за определен брой групи k, което дефинира и нулевата хипотеза. Съответно при потвърждаване на алтернативната хипотеза доказваме разлика във средните аритметични. За да е валиден анализа трябва да се посрещнат следните условия:

1. Нормално разпределение на вариациите в групите;

2. N > k+1 и n i > 1 , където N общият размер на извадката, а n е броя единици в група i.

Мощност = F(F(fc — 1,N — к, X) Ш Fi-0.(к — 1,N — к) (3)

Разпределението на F показателя при доказване на нулевата хипотеза следва централно разпределение докато, при доказване на алтернативната разпределението е нецентрално определено от параметъра - X , който зависи от размера на ефекта Д - формула 4 .

X = Д2п(М) (4)

където,

'Ztife ~М)2~

Д =

\

к

а

(5)

Недостатък на предложените формули е трудното изчисляване на стандартното отклонение и размера на ефекта. Когато изследователя е изправен пред задачата да определи необходимият брой единици на наблюдение, без да разполага с предварителни данни за величините, които го интересуват, процеса се обвързва с разход на много време за симулации с различни стойности и възможност за допускане на изчислителни грешки. С цел избягване на последните, се използват различни компютърни програми. В „R“ изчисляването на необходимия брой единици на наблюдение следва горепосочените формули. Това позволява провеждане на голямо количество симулации с различни стойности и намалява възможността за допускане на грешки. Предимство на „R“ при определяне на необходимия брой единици на наблюдение са случаите, в които няма данни за средните стойности на различните групи при ANOVA и t анализ, тъй като n се определя чрез функции за изчисляване на мощност. В тях параметрите които ни интересуват са : a -ниво на значимост, мощност на анализа и размер на ефекта. Те могат да се определят от изследователя без налични предварителни данни за изследваната съвкупност.

Цел:

Целта на настоящим доклад е да представи създадена в „R“, браузър-базирана апликация за определяне на необходимия брой единици на наблюдение, при най-често използваните в денталното материалознание методи на изследване.

Материал и методи:

За създаване на настоящата апликация се използва програмната среда „R“ Пакетът „pwr“ е създаден за изчисляване на статистическа мощност за определен статистически тест или необходим брой единици на наблюдение.

Таблица 1 Предложени от Cohen

Част от функциите му са преработени за целите на апликацията и са добавени в програмния код. Това я прави независима от промени и позволява изпълнението и да се извършва без необходимост от други пакети. Първата възможност в апликацията е определяне на конвенционален размер на ефекта зададен от Cohen(1982), чрез функцията „Cohen“ Чрез нея може да се определят стойностите при ANOVA и T тестове показни в таблица 1. Посочените размери на ефекта са ориентировъчни. Техният избор трябва да е съобразен с индивидуалните изисквания за конкретния експеримент.

Размер на ефекта ANOVA t test

малък 0.1 0.2

среден 0.25 0.5

голям 0.4 0.8

Другите две функции, които се използват са „ANOVA“ и „ttestES“. И при двете параметърът за брой на единиците на наблюдение не е зададен в командния ред. Това кара „R“ да изчисли чрез алгоритъм стойност, удовлетворяваща изискването на уравненията за мощност при двата статистически анализа. При въвеждане на останалите параметри - а - ниво на значимост, мощност на анализа и размер на ефекта се получава необходимият брой единици на наблюдение.

За да се улесни потребителят и да се направи апликацията интуитивна се използва пакетът „Shiny“, който позволява създаване на браузър-базирана графична среда за работа с „R“. Използва се функцията

Фигура 1 Плъзгачи за въвеждане на „navbarPage“ к°ят° разделя екрана на меню желани от потребителя стойности и два панела - страничен и основен.(фиг. 2)

Стартовият прозорец на програмата започва със страница „Инструкции“, където е обяснена принципната работа на апликацията и трите й компонента .

В страничния панел, чрез плъзгачи (фиг. 1) се въвеждат стойности на параметрите за различни тестове, които са реактивни - те попадат във функцията изчисляваща необходимия брой единици на наблюдение. В основния прозорец се извежда резултата на английски език.

Резултати и обсъждане:

Общият изглед на апликацията е показан на Фигура 2. Тя може да бъде намерена на следният интернет адрес: „http://zlatev.science:3838/zsample/“ .

Избор на тест

( J

Z'sample дава възможност за изчисляванв на квобходимият брой единица на наблюдение, при наличии данни за размер на ефекта, ниво на эначимост и мощност на използваният критерий.

За да изберете статистически анализ изберете меню • тестове

Ако не може да начислите размера на ефекта за Вашето проучване, може да използвате предложените от Cohen стойности намиращи се в менюто * Размер на ефекта.

В страничният панел чрез плъзгачи въведете желаните стойности за параметрите.

При различимте тестове размера на ефекта се изчислява с различии формули. Изберете статистически тест от левия панел за да видите формулата за размер на ефекта;

Фигура 2 Общ изглед на апликацията

Прозореца е разделен на горно, фиксирано меню, от което потребителят може да избира различните тестове. Стартовата страница „Инструкции^, дава обяснения за работа с програмата, а избора на тест извежда в основния панел формулите използвани за изчисляване на размер на ефекта при налични стойности за изследваната съвкупност. При избор за провеждане на някой от тестовете, в левия панел се намират стойностите, които трябва да с въведат от потребителя, а в основния се получават резултатите за необходимия брой единици на наблюдение. Недостатък на програмата е невъзможността да се изведат резултати на български език. Това е обща черта на голяма част от функционалните програмни езици, които не поддържат различни от английските знаци в реактивната си среда. Решението на този проблем е прибавянето на легенда указваща значението на английските термини под резултата (Фиг. 3).

Където,

к - брой на сравняааннте групп

п - брой необходими единици на наблюдение

Т' размер на ефекта

sig.level - ниво на эначимост

power - статнстическа мощност

БЕЛЕЖКА- п е брой единици необходими във вс яка трупа

От меню „тестове“ се избира желаният тест. За получаване на резултати е необходимо потребителят да зададе стойности за трите параметъра - а , мощност на анализа и размер на ефекта в левия панел.

Фигура 3 Легенда на български език Задаването им става чрез плъзгачи (фиг. 1).

Изчисляването на размера на ефекта е показано на уравнение 4. Когато липсва информация за размера на ефекта и теста за определяне на необходимият брой единици на наблюдение се извършва „ a priori “, се използват стандартните стойности предложени от Cohen изведени чрез функцията „Cohen“.

Z*Sample Инструкции за употреба Размерна ефекта * конвенционален тестове»

Избор на тест

| ANOVA

Размер на ефекта

мапьк

Конвенционален размер на ефекта по Cohen (1982)

test - ANOVA effect.size = 0.1

Където,

test - тип на статистический анализ

size • размер на ефекта ; small - малък, moderate • среден. large - голям effect.size - стойноет на размера на ефекта

Фигура 4 Стойности на стандартен размер на ефекта по Cohen

Към настоящият момент апликацията работи с тези стойности, което създава известна неточност, но дава обща представа за необходимото количество тестови образци според различните прилагани тестове. Възможно е тази неточност да бъде избегната при използване на литературни данни от експеримент с идентичен дизайн или при провеждане на пилотно проучване, където количеството единици на наблюдение е малко. Работата с апликацията е представена чрез снимки на няколко примера със случайни стойности.

В левия панел потребителят избира желания тест и големината на размер на ефекта, с който желае да работи. В основния панел се показва стойността му, като английските термини са разяснени в легендата. Примерът на Фиг. 5 е за ANOVA анализ.

Z*Sample Инструкции за угютресв рдамерна ефепэ - конвенционален тестове •

Размер на ефекта

■ 1 ■ 1 г1

Ниво на значимоет

0 ^ л-т ■

^J ’ 1 1 1 1 ' 1 1 1 ' 1 1 ' 1 ' Ч ' 1 1 ■ : 0.Н 0.1 116 02 024 0.3 0 33 3.4 0.46 03

Статистическа мощ а Щ ■

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

: : 02 :: : i : : а* 07 *4 ез •

Алторнатиана хипотеаа

дзустранна -1

I тестове с еднакви пропорции

t тест с еднакви

И - 17.17927 d - 9.6

slg. lev-el » 9.95 alternative ■ two,sided

Където,

n - Срой необходими единици на наблюдение d - размер на ефепа slg.iexel - пиво на значимоет power • статистическа мощност

atemawe - ашернативна хипотеаа, мзбира се от последнего меню БЕЛЕЖКА - п е брой единици необходими във всяка трупа

Фигура 6 Необходим брой единици на наблюдение при t тест

D 0.1 0.1 0.3 3.4 0.6 04 01 0.3 0.»

Ниво на значимоет а Щ

■ I 1 1 I 1 1 I i о и от 018 о:

Статистическа мощ

D 0.1 02 03 3.4 0.0 04 01 03 0.0 1

slg.level - 9.05 power - 9.8

Където,

k - срой на сравняваниге групи

п • брой необходими единици на наблюдение

Т - размер на ефекта

slg level • ниво на значимоет

power - статистическа мощност

БЕЛЕЖКА - п е брой единици необходими във всяка трупа

Фигура 5 Необходим брой единици на наблюдение при ANOVA анализ

В левия панел потребителят, чрез плъзгачи избира желаните стойности на параметрите. В основния панел се показват резултатите, като английските термини са разяснени в легендата.

Заключение:

Използването на апликацията за определяне на необходим брой единици на наблюдение - Z*sample, е лесно и интуитивно. Въпреки ограниченията си, тя е полезен инструмент позволяващ на изследователя да определи необходимото количество образци, които трябва да се изработят, с достатъчна точност за получаване на достоверни резултати. В бъдещи версии на програмата се планира включване на допълнителни статистически тестове, както и възможност потребителя да изчислява размера на ефекта според налични данни.

Библиография:

Ambrosano, G.M.B. et al., 2004. Use of statistical procedures in Brazilian and international dental journals. Brazilian Dental Journal, 15(3), pp.231-237.

Binu, V.S., Mayya, S.S. & Dhar, M., 2014. Some basic aspects of statistical methods and sample size determination in health science research. Ayu, 35(2), pp. 119—123.

Dimitrov, I., 2007. Foundations of scientific research in medicine First., Plovdiv: VAP.

Dimitrov, I., 1996. Statistics in medicinde Second. I. Nikolov, ed., Plovdiv: Pigmalion.

Gravetter, F.J., 2013. Statistics for the Behavioral Sciences,

Jain, S., Gupta, A. & Jain, D., COMMON STATISTICAL TESTS IN DENTAL RESEARCH. Journal of Advanced Medical and Dental Sciences Research J Adv Med Dent Scie Res, 33(3), pp.38-45. .

Krithikadatta, J. & Valarmathi, S., 2012. Research methodology in dentistry: Part II -The relevance of statistics in research. Journal of conservative dentistry: JCD, 15(3), pp.206-13. .

Lwanga S.K. & Lemeshow S., 1991. Sample size determination in health studies A practicle manual. World Health Organization, p.38.

Ranchov, G., 1997. Statistics in medicine First. I. Saikova & V. Borisov, eds., Sofia: Goreks Press.

i Надоели баннеры? Вы всегда можете отключить рекламу.