Minst kvadraters regression

Definition av regressionsmetod med lägsta kvadrater

En regressionsmetod med minsta kvadrat är en form av regressionsanalys som fastställer förhållandet mellan den beroende och oberoende variabeln tillsammans med en linjär linje. Denna linje kallas "linjen med bästa passform".

Regressionsanalys är en statistisk metod med hjälp av vilken man kan uppskatta eller förutsäga de okända värdena för en variabel från de kända värdena för en annan variabel. Variabeln som används för att förutsäga variabelräntan kallas den oberoende eller förklarande variabeln och variabeln som förutses kallas den beroende eller förklarade variabeln.

Låt oss överväga två variabler x & y. Dessa ritas upp i en graf med värdena x på x-axelvärdena av y på y-axeln. Dessa värden representeras av punkterna i nedanstående diagram. En rak linje dras genom prickarna - kallas linjen för bästa passform.

Målet med minsta kvadraters regression är att säkerställa att linjen som dras genom uppsättningen av angivna värden etablerar det närmaste förhållandet mellan värdena.

Formel för regression av minsta kvadrater

Regressionslinjen enligt metoden med minst kvadrater beräknas med följande formel -

ŷ = a + bx

Var,

  • ŷ = beroende variabel
  • x = oberoende variabel
  • a = y-skärning
  • b = linjens lutning

Lutningen på linje b beräknas med följande formel -

Eller

Y-skärning, 'a' beräknas med hjälp av följande formel -

Line of Best Fit in the Least Square Regression

Linjen med bästa passform är en rak linje som dras genom en spridning av datapunkter som bäst representerar förhållandet mellan dem.

Låt oss överväga följande graf där en uppsättning data ritas längs x- och y-axeln. Dessa datapunkter visas med de blå prickarna. Tre linjer dras genom dessa punkter - en grön, en röd och en blå linje. Den gröna linjen passerar genom en enda punkt och den röda linjen passerar genom tre datapunkter. Den blå linjen passerar emellertid genom fyra datapunkter och avståndet mellan de återstående punkterna till den blå linjen är minimalt jämfört med de andra två linjerna.

I ovanstående diagram representerar den blå linjen linjen med bästa passform eftersom den ligger närmast alla värden och avståndet mellan punkterna utanför linjen till linjen är minimalt (dvs. avståndet mellan resterna till linjen med bästa passform - kallas även summan av kvadraterna av rester). I de andra två raderna, den orange och den gröna, är avståndet mellan resterna till linjerna större jämfört med den blå linjen.

Metoden med minsta kvadrater ger det närmaste förhållandet mellan de beroende och oberoende variablerna genom att minimera avståndet mellan resterna och linjen för bästa passning, dvs summan av kvadrater av rester är minimal under denna metod. Därav termen "minsta kvadrater".

Exempel på regressionslinje för minsta kvadrater

Låt oss tillämpa dessa formler i frågan nedan -

Du kan ladda ner denna Excel-mall för minsta kvadrater regression här - Excel-mall för minsta kvadrater regression

Exempel nr 1

Detaljerna om teknikerns erfarenhet i ett företag (under ett antal år) och deras prestandaklassificering finns i tabellen nedan. Använd dessa värden för att uppskatta prestandan för en tekniker med 20 års erfarenhet.

Lösning -

För att beräkna de minsta kvadraterna först beräknar vi Y-skärningspunkten (a) och lutningen för en linje (b) enligt följande -

Lutningen på linje (b)

  • b = 6727 - [(80 * 648) / 8] / 1018 - [(80) 2/8]
  • = 247/218
  • = 1,13

Y-skärning (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

Regressionslinjen beräknas enligt följande -

Ersätter 20 för värdet x i formeln,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Prestandan för en tekniker med 20 års erfarenhet uppskattas till 92,3.

Exempel 2

Regressionsekvation med minst kvadrater med hjälp av Excel

Regressionsekvationen med minsta kvadrat kan beräknas med hjälp av excel enligt följande steg -

  • Infoga datatabell i Excel.

  • Infoga ett spridningsdiagram med datapunkterna.

  • Infoga en trendlinje i spridningsdiagrammet.

  • Under trendlinjealternativ - välj linjär trendlinje och välj visningsekvation i diagrammet.

  • Regressionsekvationen med minsta kvadrat för den angivna uppsättningen exceldata visas i diagrammet.

Således beräknas regressionsekvationen med minsta kvadrat för den angivna uppsättningen exceldata. Med hjälp av ekvationen kan förutsägelser och trendanalyser göras. Excel-verktyg ger också detaljerade regressionsberäkningar.

Fördelar

  • Metoden med minst kvadrat för regressionsanalys passar bäst för förutsägelsesmodeller och trendanalyser. Det används bäst inom områdena ekonomi, finans och aktiemarknader där värdet på en framtida variabel förutses med hjälp av befintliga variabler och förhållandet mellan densamma.
  • Metoden med minsta kvadrater ger det närmaste förhållandet mellan variablerna. Skillnaden mellan summan av kvadrater av rester till linjen för bästa passform är minimal under denna metod.
  • Beräkningsmekanismen är enkel och enkel att använda.

Nackdelar

  • Metoden med minsta kvadrater bygger på att det närmaste förhållandet mellan en given uppsättning variabler fastställs. Beräkningsmekanismen är känslig för data och i händelse av avvikelser (exceptionella data) kan resultatet ha en större inverkan.
  • Denna typ av beräkning passar bäst för linjära modeller. För icke-linjära ekvationer tillämpas mer uttömmande beräkningsmekanismer.

Slutsats

Metoden med minst kvadrater är en av de mest populära metoderna för förutsägelsesmodeller och trendanalyser. När det beräknas på rätt sätt ger det de bästa resultaten.