Pearson korrelationskoefficient

Pearson korrelationskoefficient definition

Pearson korrelationskoefficient, även känd som Pearson R statistiska test, mäter styrka mellan de olika variablerna och deras samband. Närhelst något statistiskt test utförs mellan de två variablerna är det alltid en bra idé för den som gör analysen att beräkna värdet på korrelationskoefficienten för att veta att hur starkt förhållandet mellan de två variablerna är.

Pearsons korrelationskoefficient returnerar ett värde mellan -1 och 1. Tolkningen av korrelationskoefficienten är som under:

  • Om korrelationskoefficienten är -1, indikerar det en stark negativ relation. Det innebär en perfekt negativ relation mellan variablerna.
  • Om korrelationskoefficienten är 0 indikerar det ingen relation.
  • Om korrelationskoefficienten är 1 indikerar det ett starkt positivt förhållande. Det innebär en perfekt positiv relation mellan variablerna.

Ett högre absolut värde på korrelationskoefficienten indikerar ett starkare samband mellan variabler. Således indikerar en korrelationskoefficient 0,78 en starkare positiv korrelation jämfört med ett värde på säg 0,36. På liknande sätt indikerar en korrelationskoefficient på -0,87 en starkare negativ korrelation jämfört med en korrelationskoefficient på säg -0,40.

Med andra ord, om värdet ligger i det positiva området, visar det att förhållandet mellan variabler är korrelerat positivt, och båda värdena minskar eller ökar tillsammans. Å andra sidan, om värdet ligger i det negativa området, visar det att förhållandet mellan variabler är korrelerat negativt, och båda värdena kommer att gå i motsatt riktning.

Pearson korrelationskoefficientformel

Pearsons korrelationskoefficientformel är som följer,

Var,

  • r = Pearson-koefficient
  • n = antalet beståndspar
  • ∑xy = summan av produkterna i de parade lagren
  • ∑x = summan av x-poängen
  • ∑y = summan av y-poängen
  • ∑x2 = summan av kvadraten x poängen
  • ∑y2 = summan av y-poängen i kvadrat

Förklaring

Steg 1: Ta reda på antalet par variabler, som betecknas med n. Låt oss anta att x består av 3 variabler - 6, 8, 10. Låt oss anta att y består av motsvarande 3 variabler 12, 10, 20.

Steg 2: Lista ned variablerna i två kolumner.

Steg 3: Ta reda på produkten av x och y i den tredje kolumnen.

Steg 4: Ta reda på summan av värden för alla x-variabler och alla y-variabler. Skriv resultaten längst ner i första och andra kolumnen. Skriv summan av x * y i den tredje kolumnen.

Steg 5: Ta reda på x2 och y2 i fjärde och femte kolumnerna och deras summa längst ner på kolumnerna.

Steg 6: Infoga värdena som finns ovan i formeln och lösa det.

r = 3 * 352-24 * 42 / √ (3 * 200-242) * (3 * 644-422)

= 0,7559

Exempel på Pearson korrelationskoefficient R

Du kan ladda ner denna Pearson korrelationskoefficient Excel-mall här - Pearson korrelationskoefficient Excel-mall

Exempel 1

I detta exempel med hjälp av följande detaljer i tabellen över de 6 personer som har en annan ålder och olika vikter som anges nedan för beräkning av värdet på Pearson R

Lösning:

För beräkning av Pearson-korrelationskoefficienten beräknar vi först följande värden,

Här är det totala antalet personer 6 så, n = 6

Nu är beräkningen av Pearson R som följer,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
  • r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (83622- 82618) / (√ [43680-40804] * [170190- 167281)
  • r = 1004 / (√ [2876] * [2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892.452938
  • r = 0,35

Således är värdet på Pearson-korrelationskoefficienten 0,35

Exempel 2

Det finns två aktier - A och B. Deras aktiekurser vissa dagar är följande:

Ta reda på Pearson-korrelationskoefficienten från ovanstående data.

Lösning:

Först beräknar vi följande värden.

Beräkningen av Pearson-koefficienten är som följer,

  • r =  (5 * 1935-266 * 37) / ((5 * 14298- (266) ^ 2) * (5 * 283- (37) ^ 2)) ^ 0,5
  • = -0,9088

Därför är Pearson-korrelationskoefficienten mellan de två bestånden -0,9088.

Fördelar

  • Det hjälper till att veta hur starkt förhållandet mellan de två variablerna är. Inte bara närvaron eller frånvaron av korrelationen mellan de två variablerna indikeras med Pearson-korrelationskoefficienten utan den bestämmer också den exakta omfattningen i vilken dessa variabler är korrelerade.
  • Med denna metod kan man fastställa korrelationsriktningen, dvs om korrelationen mellan två variabler är negativ eller positiv.

Nackdelar

  • Pearson-korrelationskoefficienten R är inte tillräcklig för att avgöra skillnaden mellan de beroende variablerna och de oberoende variablerna eftersom korrelationskoefficienten mellan variablerna är symmetrisk. Till exempel, om en person försöker veta sambandet mellan hög stress och blodtryck, kan man hitta det höga värdet av korrelationen som visar att hög stress orsakar blodtrycket. Om nu variabeln byts ut blir resultatet i så fall också detsamma vilket visar att stress orsakas av blodtrycket som inte ger någon mening. Således bör forskaren vara medveten om de data som han använder för att genomföra analysen.
  • Med den här metoden kan man inte få information om linjens lutning eftersom den bara anger om något samband mellan de två variablerna existerar eller inte.
  • Det är troligt att Pearson-korrelationskoefficienten kan tolkas felaktigt, särskilt i fall av homogena data.
  • Jämfört med andra beräkningsmetoder tar den här metoden mycket tid för att nå resultaten.

Viktiga punkter

  • Värdena kan sträcka sig från värdet +1 till värdet -1, där +1 anger det perfekta positiva förhållandet mellan de variabler som beaktas, -1 indikerar det perfekta negativa sambandet mellan de variabler som beaktas och ett 0-värde indikerar att inget samband mellan de variabler som beaktas.
  • Den är oberoende av måttenheten för variablerna. Till exempel, om måttenheten för en variabel är i år medan måttenheten för den andra variabeln är i kg, ändras inte heller värdet på denna koefficient.
  • Korrelationskoefficienten mellan variablerna är symmetrisk vilket innebär att värdet på korrelationskoefficienten mellan Y och X eller X och Y kommer att förbli densamma.

Slutsats

Pearson korrelationskoefficient är den typ av korrelationskoefficient som representerar förhållandet mellan de två variablerna som mäts på samma intervall eller samma förhållandesskala. Det mäter styrkan i förhållandet mellan de två kontinuerliga variablerna.

Det anger inte bara närvaron eller frånvaron av korrelationen mellan de två variablerna utan det bestämmer också exakt i vilken utsträckning dessa variabler är korrelerade. Den är oberoende av måttenheten för variablerna där värdena för korrelationskoefficienten kan sträcka sig från värdet +1 till värdet -1. Det räcker dock inte att se skillnaden mellan de beroende variablerna och de oberoende variablerna.