Was ist minimieren (Mathe)?

2 Antworten

Von Experte Mathmaninoff, UserMod Light bestätigt

Hallo,

im Grunde hast Du es ja schon richtig beschrieben. Man sucht eine Gerade, die an Punkten, die zufällig verteilt sind, aber schon irgendwie in einem Streifen liegen, möglichst nah vorbeiführt.

Bei zwei Punkten wäre das immer die Verbindungsgerade - aber ab drei Punkten, die nicht auf einer Linie liegen, muß die ideale Gerade nicht unbedingt - eher gar nicht - durch zwei oder auch nur einen dieser Punkte führen.

Zeichnest Du die gegebenen Punkte, die hier als (xi|yi) bezeichnet sind, also
(x1|y1); (x2|y2) usw. bis (xn|yn), wobei 1; 2;...n einfach nur Indizes sind, um die einzelnen Punkte zu unterscheiden, kannst Du die senkrechten Abstände bestimmen, indem Du von den y-Koordinaten der Punkte jeweils die Funktionswerte der Geraden an der Stelle xi, also an der x-Koordinate des jeweiligen Punktes, abziehst.

Da die allgemeine Geradengleichung y=mx+b lautet und wenn Du darin einen der Punkte xi, also x1,x2 usw. mit den dazugehörigen y-Koordinaten y1, y2 usw. einsetzt, sieht das so aus: yi-(mxi+b) oder nach Auflösen der Klammer:

yi-mxi-b.

Da die Gerade mal unter, mal über den Punkten vorbeiläuft, wären die Abstände mal positiv, mal negativ, so daß Du bei einer Summe negative und positive Werte verrechnen würdest und nicht auf das Ergebnis der Gesamtlänge der Abstände - von denen ja nur die Beträge interessieren - kommen würdest.

Um das zu vermeiden, quadriert man einfach die einzelnen Abstände. So bekommt man immer positive Ergebnisse, deren einzelne Werte nun einfach addiert werden können.

m und b aus der Geradengleichung müssen bei der linearen Regression nun so bestimmt werden, daß die Summe der Quadrate der einzelnen Abstände minimal wird, denn nur dann führt die Gerade möglichst dicht an diesen zufällig verteilten Punkten vorbei.

Herzliche Grüße,

Willy

Von Experte Willy1729 bestätigt

Minimire S² durch Wahl von m und b, heißt, dass Du für m und b Werte finden sollst, sodass S² minimal wird, also dass es dann keine anderen m und b gibt, wo S² noch kleiner wäre.

x_i und y_i sind die x- bzw. y-Koordinate des i-ten Punktes. Insgesamt sind die N Punkte (x_1, y_1), ..., (x_N, y_N) vorgegeben.

Die Summe der Abweichungsquadrate ist nochmal ein bisschen was anderes als die Varianz. Bei fest vorgegeben Punkten bedeutet eine kleinere Summe, eine genauere Gerade. Bei mehr vorgegebenen Punkten wird aber die Summe größer, sodass man die Summe der Abweichungsquadrat nicht als allgemeines Maß verwendet, wie gut die Regressionsgerade ist. Stattdessen kann man das Bestimmtheitsmaß verwenden.