Regressionsanalys

Regressionslinjen i blått är funktionen som bäst approximerar de röda datapunkterna
Linjär regression, beroende av koordinatsystemet. Regressionslinje beräknad som y=f(x) (blå linje) eller x=f(y) (grön linje). Röd linje har minimal summa av vinkelräta avstånd till punkterna. Punktsvärmen vrids kring origo = (mx, my).

Regressionsanalys, regression, är en metod inom statistik där målet är att skapa en funktion som bäst passar observerade data.

Enkel linjär regression

Vid enkel linjär regression utgår man från att en rät linje kan anpassas till data och regressionsekvationen är då

där y (vertikal) är den beroende (den som påverkas) variabeln och x (horisontell) är den oberoende (den som påverkar)[1]. Interceptet med y-axeln a och lutningen b beräknas så att felet jämfört med observerade data blir så litet som möjligt. Felet kan beräknas med exempelvis minstakvadratmetoden eller maximum likelihood.

Linjär regression förutsätter att variablerna är på intervallskalenivå.

Regressionslinjen beror inte enbart på punktsvärmens utseende utan även på dess orientering i koordinatsystemet, vilket visas av vidstående bild. Man får också en annan linje om oberoende/beroende variabel byts.

Andra varianter av regressionsanalys

Se även

Källor

  1. ^ Brolin, Lars-Christer (2011). Analys i en variabel, Studentlitteratur. sid. sid. 154-157. 

Externa länkar

Media som används på denna webbplats

Question book-4.svg
Författare/Upphovsman: Tkgd2007, Licens: CC BY-SA 3.0
A new incarnation of Image:Question_book-3.svg, which was uploaded by user AzaToth. This file is available on the English version of Wikipedia under the filename en:Image:Question book-new.svg
Linear regression, rotating coordinate system.gif
Författare/Upphovsman: DEm, Licens: CC BY-SA 4.0
Linear regression, dependence on coordinate system. The regression line is calculated as y=f(x) (blue line) or x=f(y) (green line). The red line has the minimal sum of perpendicular distances to the points. The lines are calculated for different orientations of the points around the origin = (mx, my).
LinearRegression.svg
Illustration of linear regression on a data set.