Centrala gränsvärdessatsen

Definition av Central Limit Theorem

Den centrala gränssatsen säger att slumpmässiga prover från en slumpmässig populationsvariabel med någon fördelning kommer att närma sig att vara en normal sannolikhetsfördelning när storleken på provet ökar och det antar att eftersom storleken på provet i populationen överstiger 30, är ​​medelvärdet av urvalet som genomsnittet av alla observationer för urvalet kommer att vara nästan lika med genomsnittet för befolkningen.

Formel för central gränssats

Vi har redan diskuterat att när provstorleken överstiger 30 tar distributionen formen av en normalfördelning. För att bestämma normalfördelningen för en variabel är det viktigt att känna till dess medelvärde och dess varians. En normalfördelning kan anges som

X ~ N (u, a)

Var

  • N = inga observationer
  • µ = medelvärdet av observationerna
  • α = standardavvikelse

I de flesta fall avslöjar observationerna inte mycket i sin råa form. Så det är mycket viktigt att standardisera observationerna för att kunna jämföra det. Det görs med hjälp av z-poängen. Det är nödvändigt att beräkna Z-poängen för en observation. Formeln för att beräkna z-poängen är

Z = (X- µ) / a / √n

Var

  • Z = Z-poäng för observationerna
  • µ = medelvärdet av observationerna
  • α = standardavvikelse
  • n = provstorlek

Förklaring

Den centrala gränssatsen anger att slumpmässiga prover från en populations slumpmässig variabel med vilken fördelning som helst kommer att närma sig att vara en normal sannolikhetsfördelning när storleken på provet ökar. Den centrala gränssatsen antar att eftersom storleken på provet i populationen överstiger 30, kommer medelvärdet av provet att medelvärdet av alla observationer för provet kommer att vara nära lika med genomsnittet för befolkningen. Dessutom kommer standardavvikelsen för provet när storleken på provet överstiger 30 att vara lika med standardavvikelsen för befolkningen. Eftersom urvalet slumpmässigt väljs från hela populationen och storleken på provet är mer än 30, hjälper det vid hypotesprovning och konstruktion av konfidensintervallet för hypotesprovningen.

Exempel på Central Limit Theorem Formula (med Excel-mall)

Du kan ladda ner denna Excel-mall för Central Limit Theorem Formula här - Central Limit Theorem Formula Excel-mall

Exempel nr 1

Låt oss förstå begreppet normal distribution med hjälp av ett exempel. Den genomsnittliga avkastningen från en fond är 12% och standardavvikelsen från den genomsnittliga avkastningen för investeringsfonden är 18%. Om vi ​​antar att fördelningen av avkastningen normalt distribueras än låt oss tolka fördelningen för avkastningen i placeringen i fonden.

Given,

  • Den genomsnittliga avkastningen för investeringen blir 12%
  • Standardavvikelsen blir 18%

Så för att ta reda på avkastningen för ett 95% konfidensintervall kan vi ta reda på det genom att lösa ekvationen som

  • Övre intervall = 12 + 1,96 (18) = 47%
  • Lägre intervall = 12 - 1,96 (18) = -23% 

Resultatet innebär att 95% av avkastningen från fonden kommer att ligga i intervallet 47% till -23%. I detta exempel kommer urvalsstorleken, som är avkastningen på ett slumpmässigt urval på mer än 30 observationer av avkastningen, att ge oss resultatet för populationens avkastning för den gemensamma fonden, eftersom provfördelningen normalt kommer att fördelas.

Exempel 2

Fortsätt med samma exempel, låt oss avgöra vad som blir resultatet för ett 90% konfidensintervall

Given,

  • Den genomsnittliga avkastningen för investeringen blir 12%
  • Standardavvikelsen blir 18%

Så för att ta reda på avkastningen för ett 90% konfidensintervall kan vi ta reda på det genom att lösa ekvationen som

  • Övre intervall = 12 + 1,65 (18) = 42%
  • Lägre intervall = 12 - 1,65 (18) = -18%

Resultatet betyder att 90% av avkastningen från fonden kommer att ligga i intervallet 42% till -18%.

Exempel # 3

Fortsätt med samma exempel, låt oss bestämma vad som blir resultatet för ett 99% konfidensintervall

Given,

  • Den genomsnittliga avkastningen för investeringen blir 12%
  • Standardavvikelsen blir 18%

Så för att ta reda på avkastningen för ett 90% konfidensintervall kan vi ta reda på det genom att lösa ekvationen som

  • Övre intervall = 12 + 2,58 (18) = 58%
  • Lägre intervall = 12 - 2,58 (18) = -34% 

Resultatet innebär att 99% av avkastningen från fonden kommer att ligga i intervallet 58% till -34%.

Relevans och användning

Den centrala gränssatsen är extremt användbar eftersom den gör det möjligt för forskaren att förutsäga medelvärdet och standardavvikelsen för hela befolkningen med hjälp av urvalet. Eftersom urvalet slumpmässigt väljs från hela populationen och storleken på urvalet är mer än 30, kommer alla slumpmässiga urvalsstorlekar som tas från populationen att närma sig att distribueras normalt vilket kommer att hjälpa till vid hypotesprovning och konstruktion av konfidensintervallet för hypotes testning. På grundval av den centrala gränssatsen,forskaren kan välja valfritt slumpmässigt urval från hela populationen och när storleken på provet är mer än 30 kan den förutsäga populationen med hjälp av urvalet eftersom provet kommer att följa en normalfördelning och även som medelvärdet och standardavvikelsen för provet kommer att vara samma som medelvärdet och standardavvikelsen för befolkningen.