Kovarians vs korrelation

Skillnaden mellan kovarians och korrelation

Kovarians och korrelation är två termer som är exakt motsatta varandra, de används båda i statistik och regressionsanalys, kovarians visar oss hur de två variablerna skiljer sig från varandra medan korrelationen visar oss förhållandet mellan de två variablerna och hur är de relaterade .

Korrelation och kovarians är två statistiska begrepp som används för att bestämma sambandet mellan två slumpmässiga variabler. Korrelation definierar hur en förändring i en variabel kommer att påverka den andra medan kovarians definierar hur två objekt varierar tillsammans. Förvirrande? Låt oss dyka vidare för att förstå skillnaden mellan dessa närbesläktade termer.

Vad är kovarians?

Kovarians mäter hur två variabler rör sig i förhållande till varandra och är en förlängning av variansbegreppet (som berättar om hur en enda variabel varierar). Det kan ta vilket värde som helst från -∞ till + ∞.

  • Ju högre detta värde, mer beroende är förhållandet. Ett positivt tal betyder positiv kovarians och anger att det finns en direkt relation. Effektivt betyder detta att en ökning av en variabel också skulle leda till en motsvarande ökning av den andra variabeln förutsatt att andra förhållanden förblir konstanta.
  • Å andra sidan betyder ett negativt tal negativ kovarians som indikerar ett omvänt förhållande mellan de två variablerna. Även om kovarians är perfekt för att definiera typen av relation, är det dåligt för att tolka dess storlek.

Vad är korrelation?

Korrelation är ett steg före kovariansen eftersom den kvantifierar förhållandet mellan två slumpmässiga variabler. Enkelt uttryckt är det ett mått på hur dessa variabler förändras i förhållande till varandra (normaliserat kovariansvärde).

  • Till skillnad från kovarians har korrelationen ett övre och nedre lock på ett intervall. Det kan bara ta värden mellan +1 och -1. En korrelation på +1 indikerar att slumpmässiga variabler har en direkt och stark relation.
  • Å andra sidan indikerar korrelation på -1 att det finns en stark invers relation och en ökning av en variabel leder till en lika och motsatt minskning av den andra variabeln. 0 indikerar att de två siffrorna är oberoende.

Formel för kovarians och korrelation

Låt oss uttrycka dessa två begrepp matematiskt. För två slumpmässiga variabler A och B med medelvärden som Ua och Ub och standardavvikelse som Sa respektive Sb:

Effektivt kan förhållandet mellan de två definieras som:

Både korrelationer och kovarians hittar tillämpning inom statistisk och finansiell analys. Eftersom korrelation standardiserar förhållandet är det bra att jämföra två variabler. Detta hjälper analytiker att komma med strategier som parhandel och säkring för inte bara effektiv avkastning på portföljen utan också att skydda dessa avkastningar när det gäller negativa rörelser på aktiemarknaden.

Korrelation mot kovariansinfografik

Låt oss se den största skillnaden mellan korrelation mot kovarians.

Viktiga skillnader

  • Kovarians är en indikator på i vilken grad två slumpmässiga variabler förändras i förhållande till varandra. Korrelation å andra sidan mäter styrkan i detta förhållande. Korrelationsvärdet är bundet på övre med +1 och på nedre sida med -1. Således är det ett bestämt intervall. Området för kovarians är dock obegränsat. Det kan ta vilket positivt eller vilket negativt värde som helst (teoretiskt är intervallet-range till + ∞). Du kan vara säker på att en korrelation på .5 är större än .3 och den första uppsättningen siffror (med korrelation som .5) är mer beroende av varandra än den andra uppsättningen (med korrelation som .3) Att tolka ett sådant resultat skulle vara mycket svårt från kovariansberäkningar.
  • Skalförändring påverkar kovariansen. Till exempel, om värdet på två variabler multipliceras med liknande eller olika konstanter, påverkar detta den beräknade kovariansen för dessa två siffror. Att använda samma mekanism för korrelation ändrar dock inte multiplikation med konstanter det tidigare resultatet. Detta beror på att en skalförändring inte påverkar korrelationen.
  • Till skillnad från kovarians är korrelation ett enhetsfritt mått på interberoendet mellan två variabler. Detta gör det enkelt för beräknade korrelationsvärden att jämföra över två variabler oavsett deras enheter och dimensioner.
  • Kovarians kan beräknas för endast två variabler. Korrelationen kan å andra sidan beräknas för flera uppsättningar siffror. En annan faktor som gör korrelationen önskvärd för analytiker jämfört med kovarians.

Kovarians jämförande jämförelsetabell

GrundKovariansKorrelation
MenandeKovarians är en indikator på i vilken utsträckning två slumpmässiga variabler är beroende av varandra. Ett högre tal anger högre beroende.Korrelation är en indikator på hur starkt dessa två variabler är relaterade förutsatt att andra förhållanden är konstanta. Det maximala värdet är +1 som anger en perfekt beroende relation.
RelationKorrelation kan härledas från kovariansKorrelation ger ett mått på kovarians i standardskala. Det härleds genom att dela den beräknade kovariansen med standardavvikelse.
VärdenVärdet av kovarians ligger i intervallet -∞ och + ∞.Korrelationen är begränsad till värden mellan intervallet -1 och +1.
SkalbarhetPåverkar kovariansKorrelationen påverkas inte av en förändring i skalor eller multiplicering med en konstant.
EnheterKovarians har en bestämd enhet eftersom den härleds genom multiplicering av två tal och deras enheter.Korrelation är ett enhetslöst absolut tal mellan -1 och +1 inklusive decimalvärden.

Slutsats

Korrelation och kovarians är mycket nära besläktade med varandra och ändå skiljer de sig mycket. Kovarians definierar typen av interaktion, men korrelation definierar inte bara typen utan också styrkan i detta förhållande. Av denna anledning kallas korrelation ofta som det speciella fallet med kovarians. Men om man måste välja mellan de två, föredrar de flesta analytiker korrelation eftersom den förblir opåverkad av förändringarna i dimensioner, platser och skala. Eftersom det är begränsat till ett intervall från -1 till +1 är det användbart att göra jämförelser mellan variabler över domäner. En viktig begränsning är dock att båda dessa begrepp mäter det enda linjära förhållandet.