24 oktober 2016

Beräkning av stickprov

Att validera hela register mot källdata eller adjudicering är inte möjligt, annat än undantagsvis. Validering av urval kan göras med nästan lika god precision som en totalundersökning men till en betydligt lägre kostnad.

Det här är en förenklad principskiss för urval och i vissa fall kan det behövas mera komplexa eller avancerade metoder.

Hur stort stickprov behövs?

En vanlig fråga i sammanhanget är hur stort stickprov som behöver valideras. Principerna för beräkning av stickprovsstorleken är liknande de i kliniska prövningar, men för att minska de logistiska problemen och reducera behovet av att resa till olika sjukhus kan ett tvåstegsförfarande vara att föredra; först görs ett urval av sjukhus och därefter, inom varje sjukhus, ett andra urval av patienter.

Antal patienter

Antalet patienter som behövs i de två stegen beror på hur stor säkerhet man vill ha i sin uppskattning av andelen korrekta registreringar för en viss variabel. Ju större säkerhet (snävare konfidensintervall för skattningen) som önskas i uppskattningen av validiteten desto större stickprov krävs, och ju färre sjukhus som väljs i det första urvalet, desto fler patienter måste väljas i det andra för att uppnå samma säkerhet.

Beräkningen av den nödvändiga storleken på ett tvåstegsurval kompliceras något av att det inom varje sjukhus kan finnas (intraklass-) korrelation (ICC) mellan observationerna. Eftersom detta då reducerar informationsinnehållet i stickprovet krävs att den totala stickprovsstorleken är större än vad som krävs vid ett traditionellt ett-stegsurval, och ju högre korrelationen är desto större stickprov krävs.

Den faktor som beskriver hur många fler patienter som behöver inkluderas i ett tvåstegsurvalet än i ett ett-stegsurval kallas designeffekt (deff) och kan beräknas som:
deff = 1 + ICC(m - 1)

Där m är stickprovsstorlek i andra steget per förstastegsenhet. Exempelvis antalet patienter som väljs ut per sjukhus.

Det finns ett antal olika program och tabeller att tillgå för stickprovsstorleks-beräkning. Här används programmet R med biblioteket epicalc och rutinen n.for.survey.

Vid tveksamhet om hur urvalet ska göras, kontakta en statistiker.

Hjälpte informationen på sidan dig?



Tack för att du hjälper oss!