Lineare Regression Gerade?
Ich habe eine kurze Frage zur Bedeutung einer Variable.
Hier ist eine Skriptseite. f(xi) ist der Y Wert vom Punkt, yi ist der Y wert bei x(Punkt) von der Gerade, also der Fehler ist yi-f(xi), und alle Fehler zusammengezählt müssen möglichst klein sein, und man muss das Quadrat verwenden, weil die Fehler auch negativ sein können.
Jetzt dachte ich aber, dass der Y Wert von der Gerade, also Yi mit mxi-b ersetzt wird, weil es die Geradengleichung ist. Wieso wird stattdessen f(xi), also der Punkt Y-Wert mit der Geradengleichung ersetzt?
Also in anderen worten, warum ist die untere Formel nicht stattdessen Summe((mxi-b)-f(xi)^2?
Oder ist es andersherum und Yi ist das vom Punkt?
1 Antwort
f(xi)=mxi+b das entspricht deiner Modellgeraden, die die beste Abschätzung sein soll. yi entspricht allerdings dem gemessenen Wert. Idealerweise sollte yi=f(xi) sein. Jetzt schaut man sich die Differenz also den Fehler von dem idealen Wert f(xi) und des gemessenen Wertes yi an und minimiert diesen. In der Summe wurde f(xi) durch mxi+b ersetzt, was die Definition von f(xi) ist.