P-värdeformel

Vad är P-Value Formula?

P är ett statistiskt mått som hjälper forskare att avgöra om deras hypotes är korrekt. Det hjälper till att bestämma betydelsen av resultaten. Nollhypotesen är en standardposition att det inte finns något samband mellan två uppmätta fenomen. Den betecknas med H 0. En alternativ hypotes är den man skulle tro om nollhypotesen är osann. Dess symbol är H 1 eller Ha .

P-värdet i excel är ett tal mellan 0 och 1. Det finns tabeller, kalkylprogram och statistisk programvara för att beräkna p-värdet. Signifikansnivån (α) är en fördefinierad tröskel som forskaren ställer in. Det är i allmänhet 0,05. Ett mycket litet p-värde, som är lägre än signifikansnivån, indikerar att du avvisar nollhypotesen. P-värde som är större än signifikansnivån indikerar att vi misslyckas med att avvisa nollhypotesen.

Förklaring av P-värde-formeln

Formeln för beräkning av p-värdet kan härledas med följande steg:

Beräkning av P-värde från en Z-statistik

Steg 1: Vi måste ta reda på teststatistiken z

Var

  • är provandel
  • p0 är antagen befolkningsandel i nollhypotesen
  • n är provstorleken

Steg 2: Vi måste hitta motsvarande nivå av p från det erhållna z-värdet. För detta ändamål måste vi titta på z-tabellen.

Källa: www.dummies.com

Låt oss till exempel hitta värdet på p motsvarande z ≥ 2,81. Eftersom normalfördelningen är symmetrisk är negativa värden på z lika med dess positiva värden. 2.81 är en summa av 2,80 och 0,01. Titta på 2,8 i z-kolumnen och motsvarande värde på 0,01. Vi får p = 0,0025.

Exempel på P-Value Formula (med Excel-mall)

Låt oss se några enkla till avancerade exempel på P-värde-ekvationen för att förstå det bättre.

Du kan ladda ner den här P Value Formula Excel-mallen här - P Value Formula Excel-mall

Exempel nr 1

a) P-värde är 0,3015. Om signifikansnivån är 5%, ta reda på om vi kan avvisa nollhypotesen.

b) P-värde är 0,0129. Om signifikansnivån är 5%, ta reda på om vi kan avvisa nollhypotesen.

Lösning:

Använd följande data för beräkning av P-värde.

P-värde blir -

a) Eftersom p-värdet 0,3015 är större än signifikansnivån på 0,05 (5%) misslyckas vi med att avvisa nollhypotesen.

b) Eftersom p-värdet på 0,0129 är mindre än signifikansnivån på 0,05, avvisar vi nollhypotesen.

Exempel 2

27% av människorna i Indien talar hindi enligt en forskningsstudie. En forskare är nyfiken på om siffran är högre i sin by. Därför ramar han in den noll och alternativa hypotesen. Han testar H0 : p = 0,27. Ha : p> 0,27. Här är p andelen människor i byn som talar hindi. Han beställer en undersökning i sin by för att ta reda på antalet personer som kan tala hindi. Han finner att 80 av 240 personer som samplats kan tala hindi. Ta reda på det ungefärliga p-värdet för forskarens test om vi skulle anta att nödvändiga villkor är uppfyllda och signifikansnivån är 5%.

Lösning:

Använd följande data för beräkning av P-värde.

Här är provstorleken n = 240,

p 0 är befolkningsandelen. Vi måste hitta urvalsproportionen

= 80/240

= 0,33

Z-statistik

Beräkning av Z-statistik

= 0,33 - 0,27 / √ 0,27 * (1 - 0,27) / 240

Z-statistiken kommer att vara -

Z = 2,093696

P-värde kommer att vara -

P-värde = P (z ≥ 2,09)

Vi måste titta på värdet 2.09 är z-tabellen. Så vi måste titta på -2,0 i z-kolumnen och värdet i 0,09-kolumnen. Eftersom normalfördelningen är symmetrisk är arean till höger om kurvan lika med den till vänster. Vi får p-värdet som 0,0183.

P-värde = 0,0183

Eftersom p-värdet är mindre än signifikant på 0,05 (5%), avvisar vi nollhypotesen.

Obs! I Excel kommer p-värdet till 0,0181

Exempel # 3

Studier visar att ett högre antal flygbiljetter köps av män jämfört med kvinnor. De köps av män och kvinnor i förhållandet 2: 1. Undersökningen utfördes på en viss flygplats i Indien för att hitta fördelningen av flygbiljetter bland män och kvinnor. Av 150 biljetter köpte 88 biljetter av män och 62 av kvinnor. Vi måste ta reda på om den experimentella manipuleringen orsakar förändringen i resultaten, eller om vi observerar en chansvariation. Beräkna p-värdet förutsatt att signifikansgraden är 0,05.

Lösning:

Använd följande data för beräkning av P-värde.

Steg 1: Det observerade värdet är 88 för män och 62 för kvinnor.

  • Förväntat värde för män = 2/3 * 150 = 100 män
  • Förväntat värde för kvinnor = 1/3 * 150 = 50 kvinnor

Steg 2: Ta reda på chi-kvadrat

= ((88-100) 2) / 100 + (62-50) 2/50

= 1,44 + 2,88

Chi-Square (X ^ 2)

Chi-Square (X ^ 2) kommer att vara -

Chi-Square (X ^ 2) = 4,32

Steg 3: Hitta frihetsgraderna

Eftersom det finns två variabler - män och kvinnor, är n = 2

Frihetsgrader = n-1 = 2-1 =

Steg 4: Från p-värdetabellen tittar vi på den första raden i tabellen eftersom frihetsgraden är 1. Vi kan se att p-värdet ligger mellan 0,025 och 0,05. Eftersom p-värdet är mindre än graden av betydelse på 0,05, avvisar vi nollhypotesen.

P-värde blir -

P-värde = 0,037666922

Obs! Excel ger p-värdet direkt med formeln:

CHITEST (faktiskt intervall, förväntat intervall)

Exempel # 4

Det är känt att 60% av de människor som går in i klädbutiker i en stad köper något. En klädaffärsägare ville ta reda på om antalet är högre för den klädaffär som han äger. Han hade redan gjort resultaten av en studie för sin butik. 128 av 200 personer som kom in i hans butik köpte något. Butiksägaren betecknade den andel människor som kom in i hans klädaffär och köpte något. Nollhypotesen inramad av honom var p = 0,60 och den alternativa hypotesen var p> 0,60. Hitta p-värdet för forskningen vid en signifikansnivå på 5%.

Lösning:

Använd följande data för beräkning av P-värde.

Här är provstorleken n = 200. Vi måste hitta provets andel

= 128/200

= 0,64

Z-statistik

Beräkning av Z-statistik

= 0,64 - 0,60 / √ 0,60 * (1 - 0,60) / 200

Z-statistiken kommer att vara -

Z-statistik = 1,1547

P-värde = P (z ≥ 1,1547)

NORMSDIST-funktion i Excel

NORMSDIST blir -

NORMSDIST = 0,875893461

Det finns en inbyggd funktion för att beräkna ett p-värde från az-statistik i Excel. Det är känt som NORMSDIST-funktionen. Funktionen Excel NORMSDIST beräknar Standard Normal kumulativ fördelningsfunktion från ett angivet värde. Dess format är NORMSDIST (z). Eftersom z-statistikvärde finns i cell B2 är funktionen som används = NORMSDIST (B2).

P-värde kommer att vara -

P-värde = 0,122410654

Eftersom vi måste hitta området till höger om kurvan,

p-värde = 1 - 0,875893 = 0,1224107

Eftersom p-värdet på 0,1224107 är mer än en signifikant nivå på 0,05 misslyckas vi med att avvisa nollhypotesen.

Relevans och användning

P-Value har breda tillämpningar i statistisk hypotesprovning, särskilt vid nullhypotesprovning. Till exempel driver en fondförvaltare en fond. Han hävdar att avkastningen från ett visst system i fonden motsvarar Nifty, vilket är riktmärket för aktiemarknaden. Han skulle inrama nollhypotesen om att avkastningen för fonderna motsvarar Nifty. Den alternativa hypotesen skulle vara att systemets avkastning och Nifty-avkastning inte är likvärdiga. Han skulle sedan beräkna p-värdet.