Formel för provstorlek

Formel för att bestämma provets storlek på befolkningen

Provstorleksformel hjälper till att beräkna eller bestämma den minsta provstorlek som krävs för att känna till en adekvat eller korrekt andel av befolkningen tillsammans med konfidensnivån och felmarginalen.

Termen "prov" avser den del av befolkningen som gör det möjligt för oss att dra slutsatser om befolkningen och det är därför viktigt att urvalets storlek är tillräcklig så att meningsfulla slutsatser kan göras. Med andra ord är det den minsta storlek som behövs för att uppskatta den verkliga befolkningsandelen med erforderlig felmarginal och konfidensnivå. Som sådan är bestämningen av lämplig provstorlek ett av de återkommande problemen i statistisk analys. Dess ekvation kan härledas med hjälp av populationsstorlek, det kritiska värdet för normalfördelningen, provandel och felmarginal.

var,

  • N = Befolkningsstorlek,
  • Z = Kritiskt värde för normalfördelningen vid önskad konfidensnivå,
  • p = Provandel,
  • e = Felmarginal

Hur beräknar jag provstorlek? (Steg för steg)

  • Steg 1: Bestäm först befolkningsstorleken som är det totala antalet distinkta enheter i din befolkning och det betecknas med N. [Obs: Om befolkningsstorleken är mycket stor men det exakta antalet är inte känt, använd sedan 100 000 eftersom provstorleken inte förändras mycket för populationer som är större än det.]
  • Steg 2: Bestäm sedan det kritiska värdet för normalfördelningen vid önskad konfidensnivå. Till exempel är det kritiska värdet vid 95% konfidensnivå 1,96.
  • Steg 3: Bestäm sedan provproportionen som kan användas från tidigare undersökningsresultat eller samlas in genom att köra en liten pilotundersökning. [Obs: om man är osäker kan man alltid använda 0,5 som ett konservativt tillvägagångssätt och det ger största möjliga provstorlek.]
  • Steg 4: Bestäm sedan felmarginalen som är det område inom vilket den verkliga populationen förväntas ligga . [Obs: Ju mindre marginalen är, mer är precisionen och därmed det exakta svaret.]
  • Steg 5: Slutligen kan provstorleksekvationen härledas med hjälp av populationsstorlek (steg 1), det kritiska värdet för normalfördelningen vid önskad konfidensnivå (steg 2), provandel (steg 3) och felmarginal (steg 4) som visas nedan.

Exempel

Du kan ladda ner denna Excel-mall för formelformel här - Exempelmall för Excel-storlek

Exempel nr 1

Låt oss ta exemplet på en återförsäljare som är intresserad av att veta hur många av deras kunder som köpte ett objekt från dem efter att ha tittat på deras webbplats en viss dag. Med tanke på att deras webbplats i genomsnitt har 10 000 visningar per dag, bestäm provstorleken på de kunder som de måste övervaka med en konfidensnivå på 95% med en 5% felmarginal om:

  • De är osäkra på den aktuella omräkningskursen.
  • De vet från tidigare undersökningar att omvandlingsfrekvensen är 5%.

Given,

  • Befolkningsstorlek, N = 10.000
  • Kritiskt värde vid 95% konfidensnivå, Z = 1,96
  •  Felmarginal, e = 5% eller 0,05

1 - Eftersom den nuvarande omvandlingsfrekvensen är okänd, låt oss anta att p = 0,5

Därför kan provstorleken beräknas med formeln som,

= (10 000 * (1,96 2) * 0,5 * (1-0,5) / (0,05 2) / (10000 - 1 + ((1,96 2) * 0,5 * (1-0,5) / (0,05 2))))

Därför kommer 370 kunder att vara tillräckliga för att få en meningsfull slutsats.

2 - Den nuvarande omvandlingsfrekvensen är p = 5% eller 0,05

Därför kan provstorleken beräknas med ovanstående formel som,

= (10.000 * (1,96 2) * 0,05 * (1-0,05) / (0,05 2) / (10000 - 1 + ((1,96 2) * 0,05 * (1-0,05) / (0,05 2))))

Därför kommer en storlek på 72 kunder att vara tillräcklig för att härleda meningsfull slutsats.

Exempel 2

Låt oss ta exemplet ovan och i det här fallet anta att befolkningsstorleken, dvs. den dagliga webbplatsvisningen, är mellan 100.000 och 120.000, men då är det exakta värdet inte känt. Resten av värdena är desamma tillsammans med en konverteringsfrekvens på 5%. Beräkna provstorleken för både 100.000 och 120.000.

Given,

  • Provandel, p = 0,05
  • Kritiskt värde vid 95% konfidensnivå, Z = 1,96
  •  Felmarginal, e = 0,05

Därför kan provstorleken för N = 100.000 beräknas som,

= (100000 * (1,96 2) * 0,05 * (1-0,05) / (0,05 2) / (100000 - 1 + ((1,96 2) * 0,05 * (1-0,05) / (0,05 2))))

Därför kan provstorleken för N = 120 000 beräknas som,

= (120000 * (1,96 2) * 0,05 * (1-0,05) / (0,05 2) / (120000 - 1 + ((1,96 2) * 0,05 * (1-0,05) / (0,05 2))))

Därför är det bevisat att eftersom befolkningsstorleken ökar till att vara mycket stor blir den irrelevant vid beräkningen av urvalsstorleken.

Relevans och användningsområden

Beräkning av provstorlek är viktigt för att förstå begreppet lämplig urvalsstorlek eftersom den används för validiteten av forskningsresultaten. Om det är för litet kommer det inte att ge giltiga resultat, medan ett prov är för stort kan slösa bort både pengar och tid. Statistiskt sett används den betydande urvalsstorleken huvudsakligen för marknadsundersökningar, hälsoundersökningar och utbildningsundersökningar.