Научная статья на тему 'Primena testa slučajnosti za proveru hipoteze o slučajnom izboru uzorka '

Primena testa slučajnosti za proveru hipoteze o slučajnom izboru uzorka Текст научной статьи по специальности «Фундаментальная медицина»

CC BY
112
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Vojnotehnički glasnik
Scopus
Ключевые слова
statistika / test slučajnosti / uzorak / populacija / Studentov Hi t-test / Fišerov Hi F-test / statistics / randomized test / sample population / Student or t-test / Fisher or F-test

Аннотация научной статьи по фундаментальной медицине, автор научной работы — Brkić Dragoljub M.

U raduje izložen statistički test sa primerima primene, za proveru pretpostavke da je uzorak koji se ispituje izdvojen iz populacije no slučajan način. Radi ilustracije primene, primeri su urađeni primenom posebno razvijenog računarskog programa za rešavanje ovakvih problema.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of the randomized test for verifying the random sampling hypothesis

The paper gives a statistical test for verifying the hypothesis that an examined sample is randomly taken out from the population. The test is illustrated by two examples with a specially developed computer program for solving this type of problems.

Текст научной работы на тему «Primena testa slučajnosti za proveru hipoteze o slučajnom izboru uzorka »

Dr Dragoljub M. Brkić,

dipl. inž.

TehniCki opitni cenrar KoV, Beograd

PR1MENA TESTA SLUČAJNOSTIZA PROVERU H1POTEZE О SLUČAJNOM IZBORU UZORKA

UDC: 519.246: 312

Rezime:

V radu je izloien statistićki test sa primerima primene, za proveru pretpostavke da je uzorak koji se ispituje izdvojen iz populacije na slučajan naćin. Radi iiustracije primene, primeri su uradeni primenom posebno razvijenog računarskog programa za reiavanje ovakvih problema.

Kljućne reči: statistika, test slučajnosti, uzorak. populacija, Studentov ili Hest. Fišerov ili F-test.

APPLICATION OF THE RANDOMIZED TEST FOR VERIFYING THE RANDOM SAMPLING HYPOTHESIS

Summary:

The paper gives a statistical test for verifting the hypothesis that ar, examined sample is randomly taken out from the population. The test is illustrated by two examples with a specially developed computer program for solving this type of problems.

Key words: statistics, randomized test, sample population. Student or t-test, Fisher or F-test.

Uvod

Pri obradi rezultata ispitivanja, pored odbacivanja malo verovatnih vredno-sti koje je u toku ispitivanja ili praćenja poprimila posmatrana slučajna promen-Ijiva t, potrebno je da se proven da li skup vrednosti predstavlja uzorak koji je iz populacije izdvojen na slučajan način, ili su neke od njih korigovane radi prika-zivanja stanja u populaciji boljim nego Sto je ono u stvamosti. Ova korekeija može se izvršiti tako Sto se izvestan broj vrednosti uveća za odredeni iznos, ili da

se u nekom slučaju umanje zavisno od toga da li prosek slučajne promenljive treba da bude manje ili veće vrednosti. To važi za situaeije kada je obrađivaču rezultata podatke dostavio neko drugi, pa se sumnja u verodostojnost rezultata.

Promena izvesnog broja vrednosti može da bude prouzrokovana i povreme-nim sistematskim promenama faktora koji utiču na vrednosti posmatrane slu-čajne promenljive. To se može desiti ako je uzorak veliki ili ako se prikuplja u toku dužeg vremena. Otkrivanje tih nepra-vilnosti veoma je bitno za korektnu obra-

208

V0JN07EHNIĆKI GLASNIK 2/2002.

du rezultata ispitivanja. Provera hipoteze о tome da li je uzorak iz populacije iz-dvojen na slučajan način kratko se naziva test slučajnosti. Kao i svi drugi statistički testovi i ovaj test je povezan sa rizicima odluke, tj. postavljcna hipoteza se niti prihvata, niti odbacuje sa potpunom si-gumošću, već nosi i odredenu neizve-snost koja je srazmema usvojenim rizicima.

U radu je prikazan test slučajnosti koji je zasnovan na podeli broja vredno-sti uzorka na tri približno jednaka dela, i izračunavanju srednjih vrcdnosti i stan-dardnih devijacija za svaki od ovih podu-zoraka i medusobnom uporedivanju tih vrednosti uz primenu Studentovog ili /-testa i Fišerovog ili F-testa. Ako se pri-menom ta dva testa pokaže da se može usvojiti da su i srednje vrednosti i stan-dardne devijacije medusobno iste u sva tri poduzorka, tada se pretpostavka о slu-čajnosti uzorka može prihvatiti, a u pro-tivnom se odbacuje sa unapred usvojenim rizicima.

Teorijske postavke problema

Neka su tJf .... /„ vrednosti koje je slučajna promenljiva / poprimila u toku eksperimenta (ispitivanja ili praćenja). Ove vrednosti ne bi trebalo da budu ure-dene ni u rastućem ni u opadajućem po-retku. U stvari, njihov redosled bi trebalo da bude onakav kakav se dobija u toku eksperimenta. Ako su ove vrednosti ure-dene u nekom od tih poredaka, a nema polaznog neuredenog niza podataka, on-da treba ,jzme5ati“ ove vrednosti prime-nom celobrojnih pseudoslućajnih brojeva koji imaju ravnomemu raspodclu u inter-

valu [1, лј. Neuredeniniz: t,, t^ .... t„ podeli se na približno tri jednaka dela (poduzorka). Neka su brcjevi vrednosti slu-čajne promenljive t u ovim poduzorcima ti{, Пј, i n}: п,- ln/3}, П2-(п/ЗЈ i П)—п~ (tif + nj, gde je {Q} celobrojna vrednost broja Q = n/3. Naravno, mora biti n, + n2 + n} = n, gde je n ukupan broj vrednosti slučajne promenljive t u posmatranom uzorku koji je izdvojen iz populacije.

Tačkaste ocene srednjih vrednosti i standardnih devijacija za ova tri poduzorka, date su sledećim izrazima:

Л1 )• 1

(2)

П2 >-l

>щ = 1 =—(3) = (4)

(5)

V *3 ~1 /•»

Na osnovu tri srednje vrednosti za poduzorke, prikazane izrazima (1), (2) i

(3), mogu se formirati tri tačkaste ocene

VOJNOTKKNIČKI GLASNIK 2/2002.

209

Studentove ili /-statistike, koje se mogu izraziti sledećom formulom:

7 - ----------------------- ■ (7)

(n,-i)s,2+(«,-!)*; [ЦТ

п,+иу-2 \n, nt

gdeje/.y = /. 2. 3; i Фј.

Statistike t(J odnose se na prvi i drugi poduzorak prvi i treći poduzorak (tl3) i drugi i treći poduzorak (t23).

SluCajna promenijiva fy, data izra-

zom (7) ima Studentovu ili /-raspodclu sa л, + nf - 2 stepeni slobode. Kada se usvoji vrednost donjeg kvanta (rizika), p, za ovaj broj stepeni slobode л, + лу - 2, može se odrediti kvantil Studentove ili /-raspodele: tp (n, + лу - 2).

Takode, na osnovu tri standardne devijacije za poduzorke date izrazima

(4), (5) i (6), mogu se formirati tri tačka-ste ocene FiSerove ili F-statistike koje se mogu izraziti slededom formulom:

gdeje/.y = 7. 2. 3; i Фј.

Statistike Fy odnose se na prvi i drugi poduzorak (Fl2). prvi i treći poduzorak (Fl3) i drugi i treći poduzorak

(F1S>-

A

SluCajna promenijiva Ftj, data izra-

zom (8), ima FiSerovu ili F-raspodelu sa nt, - / i лу -7 stepeni slobode.

Za usvojene vrednosti donjeg i gor-njeg kvanta (rizika), p i q, respektivno, a za ove brojeve stepeni slobode л, - 7 i nf - 7, mogu se odrediti donji i gomji

kvantili F-raspodele: Fd (p; л, - 7; nt - 1)

i Fg (q; n, - l; лу - I).

Odredivanje kriterijuma za test

slučajnosti

Kvantil Studentove ili /-raspodele tp (ni + лу - 2), za poznatu vrednost broja stepeni slobode v - n, + n}- 2 i usvoje-nu vrednost donjeg rizika p, može se odrediti pomoću, za tu svrhu specijalno ura-denog, računarskog programa ili naći u odgovarajućoj statističkoj tablici. Treba napomenuti da se u nekim statističkim tablicama kvantila Studentove raspodcle daju kvantili za ukupan rizik koji je jed-nak zbiru donjeg, pt i gomjeg, q, rizika (p + q). Obično su rizici p i q medusobno jednaki, a njihove vrednosti su standardi-zovanc. U tom slučaju iz tablice treba uzeti vrednost kvantila čiji je rizik duplo veći od p. Za ovako odredenu vrednost kvantila /-raspodele, ako je ispunjen ste-deći uslov:

(n, +",~2)<',, < l', (и, + n, - 2)1 (9)

sa ukupnim rizikom p + q može sc tvrditi da su srednjc vrednos:i slučajne promenlji-ve / u prvom, drugom i trećem uzorku medusobno jednake u statističkom smislu, tj. m,» m}; i,J ~ 1, 2, 3; i Ф j.

Kvantili FiSerove ili F-raspodele: Fd (p; л, - 7; лу - l) i F/q; n, - I; n} - 7), za poznate vrednosti brojeva stepeni slobode V/ = л, - 7 i v, = лу - 7 i usvojene vrednosti donjeg i gomjeg rizika p i q, respektivno, mogu se odrediti pomoću specijalno uradenog računarskog programa ili naći u odgovarajućoj statističkoj tablici. Treba napomenuti da se u statis-tičkim tablicama obično daju vrednosti samo za gomji kvantil Fr a da se vred-

210

VO/NOTEHNlCKI GLASNIK 2/2002.

nost donjeg kvantila Fd izračunava pomoću relacije izmedu ova dva kvantila:

gdc je a =* q - gomji rizik i Fa r) Yj -gomji, a Vi - donji rizik FiSerove

ili F-raspodele.

Za ovako odredene vrednosti kvantila F-raspodele, ako je ispunjen sledeći uslov:

F<{m-ty -l)<F, <FS(<W -4-1) 00

sa ukupnim rizikom p + q može se tvrdi-ti da su standardne devijacije slučajne promenljive t u prvom, drugom i trećem uzorku medusobno jednake u sta-tističkom smislu te reči, tj. tr, - op 1, j - 1. 2. 3; i Фј.

Ako su istovremeno ispunjena oba uslova definisana izrazima (9) i (11), on-da se može prihvatiti pretpostavka da su sva in poduzorka u statističkom smislu medusobno jednaka, jer su im jednaki osnovni parametri: medusobno su jednake sve tri srednje vrednosti, kao i standardne devijacije. Treba napomenuti da je ovde reč 0 jednakosti teorijskih ili stvamih srednjih vrednosti i standardnih devijacija, respektivno, a tačkaste ocene ovih parametara, i u slučaju kada su od-govarajući teorijski parametri jednaki, medusobno se razlikuju. Medutim, ta raz-lika nijc toliko velika da bi opovrgla tvrd-nju о jednakosti teorijskih parametara.

Ako se može prihvatiti pretpostavka 0 jednakosti poduzoraka, onda bi se mo-gla prihvatiti i pretpostavka da su vred-

nosti slučajne promenljive t u tim podu-zorcima slučajno rasporedene, odnosno da je ceo osnovni uzorak izdvojen iz po-pulacije na slučajan način. Međutim, ako bi se vrednosti koje su namemo menjanc rasporedivale ravnomemo po celom sku-pu neuredenih vrednosti, ovim testom se ta nepravilnost ne bi ir.ogla otkriti. U tom slučaju morale bi se analizirati i ranije serije podataka, ako ih ima, i uporedivati sa posmatranom serijom podataka, pod pretpostavkom da u svim ranijim serija-ma nisu namemo vrSene korekcije vrednosti slučajne promenljive /.

Dakle, ovim testom slučajnosti тоге se otkriti povremena namema ili siste-matska promena izvesnog broja vrednosti slučajne promenljive t u dovoljno du-gom nizu podataka čije vrednosti ne bi trebalo da budu uiedene u rastućem ili opadajućem poretku.

Numerički primeri

Primer 1

Pri usvojenim vrednostima parametara Vejbulove raspodele: parametar raz-mere b = 100 i parametar oblika c = 2,5 generisano je n - 30 pseudoslučajnih brojeva. Ovi brojevi se pridmžuju slučaj-noj promenljivoj t koja ima dvoparame-tarsku raspodelu sa datim vrednostima parametara b i c. Vrednosti t i njihov re-dosled prikazani su po vrstama u slede-ćoj tabeli:

62,39 71,87 84.10 64,46 105,15

107,47 81,45 124,23 104,00 140,88

84,32 82,60 13,83 88,71 83,66

72,29 60,12 10,60 156,53 57,47

50,46 52,76 77,66 117,81 88,47

44,15 79.02 29,58 124,30 63,43

VOJNOTEHNlCKI GLASNIK 2/2002.

211

Primenom testa slučajnosti treba proveriti da li su ove vrednosti pseudo-slučajnih brojeva Jzabrane'* na slučajan način i usvojiti da su vrednosti donjeg i gomjeg rizika p - q - 0,05.

ReŠenje

Prema izloženom postupku, brojevi vrednosti u prvom, drugom i trećem pod-uzorku su n, - JO, n2 - JO i ns - JO. Vrednosti u prve dve vrste u tabeli pripa-daju prvom poduzorku, u trećoj i četvrtoj drugom poduzorku, a u petoj i Sestoj tre-ćem poduzorku. Na osnovu izloženog te-orijskog postupka i primenom računar-skog programa dobijene su sledeće vrednosti tačkastih ocena za srednje vrednosti i standardne devijacije poduzoraka:

mx =94,6 тг =71,013 i щ = 72,817 đ, = = 26.1 č2=sz =41,26 i đ, = j, = 31,126.

Tačkaste ocene srednje vrednosti i standardne devijacije kompletnog uzorka

su:

m = T = 79,477 i č = s = 34,048.

Tačkaste ocene Studentove ili Nstati-stike za prvi i drugi, za prvi i trcći i za drngi i trebi poduzorak imaju sledeće vrednosti: fl2 = 1,5277 tn = 1,6958 i ^ = -0,1103.

Kritična vrednost Mesta za broj ste-peni slobode v = n, + n2 — 2 = JO + JO - 2 = 18 i usvojeni donji rizik p~ 0,05 jednaka je tp (v) = t00i (18) = -1,7341.

Tačkaste ocene FiŠerove ili F-stati-stike za prvi i drugi, za prvi i treći i za drugi i treći poduzorak imaju sledeće

vrednosti: Fxl =0,4002 Fn =0,7031 i Fa = 1,7572.

Kritične vrednosti F-testa, donji i gomji kvantili, za brojeve stepeni slobode V/ = tit - 1 = 10 - 1 - 9 i v2 = ns — / = 10 -1-9 i usvojeni donji i gomji rizik p = q = 0,05 su: F«/ (p; я, - 1;

nj - 1)= Fd (0,05; 9; 9) = 0,3146 i Fg (q; Ш - 1; n} - 1) = Fg (0,05; 9; 9) = 3,1789. Ove kritične vrednosti iste su za sva tri slučaja, jer su brojevi vrednosti u podu-zorcima jednaki, a otuda su jednaki i brojevi stepeni slobode.

Dobijeni rezultati izračunavanja sta-

tistika tv i Fv; i, j - 1, 2, 3; i Ф j, pripa-

daju domenu kojeg cgraničavaju kritične vrednosti ovih statistika, pri primeni oba testa i Studentovog i FiSerovog, §to po-tvrduje pretpostavku da je uzorak Jzdvo-jen“ iz populacije na slučajan način. Ova tvrdnja iskazuje se sa rizicima p = q = 0,05.

Primer 2

Ako se u prvom poduzorku, u vred-nostima navedcnim u primeru 1, prve tri vrednosti uvećaju tako da umesto vrednosti: 62,39; 71,87 i 84,10 budu vrednosti: 124,78; 143,74 i 168,20; sprovodeći isti postupak testa slučajnosti kao u primeru 1, treba pokazati da li se sa ovako izmenjenim vrednostima može tvrditi da je uzorak,jzdvojen*4 iz populacije na slu-čajan način, usvajajući iste vrednosti rizi-ka p-q- 0,05.

Rešenje

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Prema izloženom postupku, brojevi vrednosti u prvom, drugom i trcćem poduzorku su n,- 10, n2 = 10 i n3- 10.

212

VOJNCTEHNIČKIGLASN1K 2^002.

Vrednosti u prve dve vrste u tabeli pripa-daju prvom poduzorku, u trećoj i četvrtoj drugom poduzorku i u petoj i Sestoj (re-ćem poduzorku. Na osnovu izloženog te-orijskog postupka i primenom računar-skog programa, dobijene su sledeće vrednosti tačkastih ocena za srednje vrednosti i standardne devijacije poduzoraka:

щ - 116,436 m2= 71,013 i т^= 72,817 ox-s, = 30,624 ^2“ $2 = 41,26 i

d,= s3 = 31,126.

Tačkaste ocene srednje vrednosti i standardne devijacije kompletnog uzorka su: m =7 = 86,755 i tf = * = 39,702.

Tačkaste occne Studentove ili /-statistike za prvi i drugi, za prvi i treći i za drugi i treći poduzorak imaju sledeće vrednosti:

/,2 = 2,7954 /|3=3,1589 i = -0.1103.

Kritična vrednost /-testa za broj stepe-ni slobode v- n,+ n2 - 2 = 10 + 10- 2 = = 18 i usvojeni donji rizik p = 0,05 jed-nakaje tp(v) = t0mos(!8) = -1,7341.

Tačkaste ocene FiScrove ili F-statisti-ke za prvi i drugi, za prvi i treći i za drugi i treći poduzorak imaju sledeće vrednosti: Fl2 -0,5509 Fl3 = 0,9680 i FB = 1,7572.

KritiCne vrednosti F-testa, donji i gomji kvantili, za brojeve stepeni slobode у, = л, - / = 10 - 1 = 9 i v2 = пг - 1 -- 10 - 1 = 9 i usvojeni donji i gomji rizik p = q = 0,05 su: Fj (p; л, - 1; rij - 1) = Fd (0,05; 9; 9)= 0,3146 i Fg (q; щ - 1; nj-l) = Fg (0,05; 9; 9) = 3,1789. Ove kritičnc vrednosti iste su za sva tri slu-čaja, jer su brojevi vrednosti u poduzorci-

ma jednaki, a otuda su jednaki i brojevi stepeni slobode.

Dobijeni rezultati izračunavanja statistika i FtJ\ i, j - 1. 2, 3; i Ф j, u

svim slučajevima nc pripadaju domenu kojeg ograničavaju kritične vrednosti ovih statistika, pri primeni oba testa i Studentovog i Fišerovog, Sto ukazuje na to da pretpostavku da je uzorak Jzdvo-jcn“ iz populacije na slučajan način treba odbaciti. Ova tvrdnja iskazuje se sa rizi-cima p = q- 0,05.

Zaključak

Provera pretpostavki о tome da li je uzorak koji se ispituje izdvojen iz popu-lacije na slučajan način ili su neke jedini-ce uzorka probrane radi prikazivanja populacije drugačijom nego Sto je ona u stvamosti u teoriji statistike je poznata kao klasični statistićki test. Test slučaj-nosti koji je izložen u članku, modifiko-van je radi povećanja njegove osetljivosti na otkrivanju jedinica u uzorku koje nisu ,,tipične“ za populaciju iz koje je taj uzorak izdvojen. Kriterijum za ovaj test je proširen. Tako, na primer, uveden je kompromisni kriterijun istovremenog is-punjenja zahteva Studentovog ili /-testa i FiSerovog ili F-testa, da bi se postavljena hipoteza о slučajnom izboru uzorka mo-gla prihvatiti ili odbaciti. Drugim rečima, istovremeno se proverava značajnost promenc srednje vrednosti (mere istinito-sti) i standardne devijacije (mere preci-znosti) u tri približno jednaka poduzorka na koja je podeljen osnovni uzorak. Ako u svim mogućim parovima od ovih poduzoraka (tri kombinacije bez ponavijanja) ne postoji znatna razlika izmedu njihovih srednjih vrednosti i standardnih devijaci-ja, može se prihvatiti hipoteza о slučaj-

VOINOTEHNlCtCl GLASNIK 2/2002.

213

nom izdvajanju uzorka iz populacije; u protivnom la hipoteza može da se odbaci. Ovaj test slučajnosti je sličan testu jedno-rodnosti ili homogenosti. Predložena su ui poduzorka. Medutim, ako je broj jedi-nica u osnovnom uzorku veliki može se povećati i broj poduzoraka, ali bi u tom slučaju irebalo istraživati do kojeg broja je prihvatljivo to povećanje. Navedeni primeri, koji su urađeni korišćenjem po-sebno razvijenog računarskog programa pokazuju valjanost i osetljivost opisanog testa slučajnosti.

Lilgfatvra:

(1] Fisz, M.: Wahrscheinlichkeiurechnung und Mathematische Suiistik. VEB Deutscher Ver-ag d er Wissenschaften, Berlin, 1962.

(2] Ohapouilk, P_, Pazzis. R.: Fiabilitl des Systfmes, Masson etC*. Paris. 1968.

(3] Gnedenko. B. Bdliaev, Y. Soloviev, A.: Mdthodes mathOmatiqucs en thforie de la liability, Ćditioiu, „Mir*', Moscou. 1972.

(4] Waerden, B. L : Mathcmaiische Suiistik. Springer-Vcrlag. Berlin. 196S.

(5} Bnink, H. D.: An Introduction to Mathematical Statistics, 8laisdctl Publishing Company. New York. 196$.

|6) Siojanovic. S.: Matematkka statistika, NauCns knjiga, Beograd. 1980.

(7) Ivanovk, Z.: Matematička statistika, NauCna knjiga, Beograd. 1976.

214

VOJNOIEHNIĆKI GLASNIK 2/2002.

i Надоели баннеры? Вы всегда можете отключить рекламу.