Multikollinearitet

Vad är multikollinearitet?

Multikollinearitet är ett statistiskt fenomen där två eller flera variabler i en regressionsmodell är beroende av de andra variablerna på ett sådant sätt att man kan förutsägas linjärt från den andra med hög grad av noggrannhet. Det används vanligtvis i observationsstudier och mindre populärt i experimentella studier.

Typer av multikollinearitet

Det finns fyra typer av multikollinearitet

  • # 1 - Perfekt multikollinearitet - Det finns när de oberoende variablerna i ekvationen förutsäger det perfekta linjära förhållandet.
  • # 2 - Hög multikollinearitet - Det refererar till det linjära förhållandet mellan de två eller flera oberoende variablerna som inte är perfekt korrelerade med varandra.
  • # 3 - Strukturell multikollinearitet - Detta orsakas av forskaren själv genom att infoga olika oberoende variabler i ekvationen.
  • # 4 - Databaserad multikollinäritet - Den orsakas av experiment som är dåligt utformade av forskaren.

Orsaker till multikollinearitet

Oberoende variabler, förändring av parametrarna för variablerna gör att en liten förändring i variablerna har en betydande inverkan på resultatet & Datainsamling hänvisar till urvalet av den valda populationen som tas.

Exempel på multikollinearitet

Exempel nr 1

Låt oss anta att ABC Ltd a KPO anlitas av ett läkemedelsföretag för att tillhandahålla forskningstjänster och statistisk analys av sjukdomarna i Indien. ABC AB har valt ålder, vikt, yrke, längd och hälsa som prima facie-parametrar.

  • I exemplet ovan finns en multikollinearitetssituation eftersom de oberoende variabler som valts för studien är direkt korrelerade med resultaten. därför skulle det vara tillrådligt för forskaren att justera variablerna först innan ett projekt startas, eftersom resultaten kommer att påverkas direkt på grund av de valda variablerna här.

Exempel 2

Låt oss anta att ABC Ltd har utsetts av Tata Motors för att förstå försäljningsvolymen för tata-motorer kommer att vara hög i vilken kategori på marknaden.

  • I exemplet ovan kommer först oberoende variabler att slutföras baserat på vilka forskningen behöver slutföras. det kan vara månadsinkomst, ålder. märke, lägre klass. Det betyder bara att data kommer att väljas som passar in i alla dessa flikar för att ta reda på hur många som kan köpa den här bilen (tata nano) utan att ens titta på någon annan bil.

Exempel # 3

Låt oss anta att ABC Ltd anlitas för att skicka in en rapport för att veta hur många personer under 50 år som är benägna att få hjärtinfarkt. för detta är parametrarna ålder, kön, sjukdomshistoria

  • I exemplet ovan finns det multikollinearitet som har uppstått eftersom den oberoende variabeln "ålder" måste justeras till ålder under 50 år för att bjuda in ansökningar från allmänheten så att personer som är över 50 år automatiskt blir filtrerade.

Fördelar

Nedan följer några av fördelarna

  • Linjärt förhållande mellan de oberoende variablerna i ekvationen.
  • Mycket användbart i statistiska modeller och forskningsrapporter som utarbetats av forskningsbaserade företag.
  • Direkt inverkan på önskat resultat.

Nackdelar

Nedan följer några av nackdelarna

  • I vissa situationer skulle detta problem lösas genom att samla in mer data om variablerna.
  • Felaktig användning av dummyvariabler, dvs. forskaren kan glömma att använda dummyvariablerna när det behövs.
  • Infoga två samma eller identiska variabler i ekvationen som kg och pund i vikter.
  • Infoga en variabel i ekvationen som är en kombination av 2.
  • Komplicerat att utföra beräkningar eftersom det är den statistiska tekniken och kräver att statistiska kalkylatorer gör utförandet.

Slutsats

Multikollinearitet är ett av de mest gynnade statistiska verktygen som ofta används i regressionsanalys och statistisk analys för stora databaser och önskad produktion. Alla större företag har en separat statistisk avdelning i sitt företag för att utföra statistisk regressionsanalys om produkter eller människor för att ge ledningen en strategisk bild av marknaden och också hjälpa dem att utarbeta sina långsiktiga strategier med tanke på detta. Den grafiska presentationen av analysen ger läsaren en tydlig bild av det direkta förhållandet, noggrannhet och prestanda.

  • Om forskarens mål är att förstå de oberoende variablerna i ekvationen kommer multikollinearitet att vara ett stort problem för honom.
  • Forskaren måste göra de förändringar som krävs i variablerna i steg 0 själv, annars kan det ha en enorm inverkan på resultaten.
  • Multikollinearitet kan göras genom att undersöka korrelationsmatrisen.
  • Avhjälpande åtgärder spelar en viktig roll för att lösa problemen för multikollinearitet.