Ableitung nach der j-ten Variable von f(x)=x^TAx?

Hallo,

sei f(x)=x^TAx , A∈ℝ^(nxn). Ich möchte nun D_j f(x) bestimmen. Ich habe mir gedacht, dass man auf f(x)=(x^T)(Ax) die Produktregel anwenden kann. Das ist auch in der Musterlösung so, die da lautet:

Bild zum Beitrag

Ich habe verstanden, warum die j-te Ableitung von x dann e_j ist. Aber das ganze Hin und Her mit dem Transponierten, was auch lustig von a_j^T auf x^T überspringt, komme ich nicht klar. Außerdem verstehe ich nicht, dass Ae_j=a_j^T ist - könnte da jemand vielleicht etwas Licht ins Dunkle bringen?

4 Antworten

poseidon42

Nutzer, der sehr aktiv auf gutefrage ist

im Thema Mathematik

04.04.2020, 02:00

Hier die allgemeine Ableitung nach dem Vektor x:

f(x) = x^T * A * x

--> Df(x) = D(x^T * A * x) + D(x^T * A * x)

wobei hier die Produktregel angewandt wird. Beachte:

g(x) = y^T*x = x^T * y ---> Dg(x) = y^T mit Vektoren y und x.

Entsprechend folgt hier:

(i) D(x^T * A * x) = D(x^T * A^T * x) = x^T *A (y = x^T A^T)

(ii) D(x^T * A * x) = x^T * A (y = x^T * A)

Wir erhalten also insgesamt:

Df(x) = x^T*(A + A^T)

Alternativ bestimme durch Definition der linearen Approximation:

f(x+h) = f(x) + Df(x)*h + o(||h||^2)

Hier folgt:

f(x + h) = (x + h)^T * A * (x + h) = x^T*A*x + h^T*A*x + x^T*A*h + h^T*A*h

mit h^T*A*x = x^T*A^T*h folgt dann:

f(x + h) = f(x) + x^T*(A + A^T)*h + o(||h||^2)

--> Df(x) = x^T*(A + A^T)

Piddle

04.04.2020, 00:52

Licht in das Dunkel bekommst du z.B., wenn du mal im Fall n=2 die Funktion f konkret hinschreibst. Dann ergibt sich nämlich

was man sehr leicht partiell ableiten kann.

So, und nun das Ganze mal mit n statt 2 und Summenzeichen statt +.

Hat man "bodenständig" erkannt, was da los ist, kann man auch nach einer eleganten Form suchen, wenn der sofortige Schritt dahin einem unheimlich ist.

Banach

04.04.2020, 01:22

Steh ich jetzt nicht komplett auf dem Schlauch, dann fehlt tatsächlich eine Voraussetzung für die Musterlösung. Tatsächlich gilt die Musterlösung nur, wenn A symmetrisch ist.

Woher ich das weiß:Studium / Ausbildung – Derzeit im Mathematik-Studium.

Banach

04.04.2020, 01:43

Für x, e in lR ist:

= <x,Ax> + <x,Ae> + <e,Ax> + <e,Ae>

= <x,Ax> + <x,Ae> + <Ae,x> + <e,Ae>

Nun ist wegen

<e,Ae>/||e|| <= ||A||*||e|| -> 0 für e -> 0

also Df = (A^T + A)x

und nur wenn A auch symmetrisch ist, gilt dann auch:

Df = 2*Ax.

Banach

04.04.2020, 01:50

@Banach

*lR^n

Gonti

04.04.2020, 00:12

Dieses *herumspringen* der Transponierten ist eine einfache Eigenschaft:

https://de.wikipedia.org/wiki/Transponierte_Matrix#Eigenschaften

Damit müsstest du dir jetzt die einzelnen Rechenschritte leicht klar machen sollen.

Ableitung nach der j-ten Variable von f(x)=x^TAx?

4 Antworten

Wann Kettenregel, wann Produktregel?

Warum Produktregel nur bei Fall 2?

Frage zur partiellen Ableitung (Physik)?

Ableitung Quotientenregel - verständnisfrage

was ist der unterschied zwischen der linearen Kettenregel und der normalen Kettenregel?

Wie bilde ich die 1 und 2 und 3 Ableitung?

Bei welchem a hat die Funktionenschar fa einen Wendepunkt mit y= -4?

Wie löst man diese Aufgabe: Für welche Werte von a berührt die Parabel p die x-Achse?

Kettenregel+Produktregel Extremstellen bestimmen?

Ableitung von 10xe^(-0,5x)?

Bei der LGS Ableitungen benutzen?

Null ungleich Null?

Ableitung Mathematik Klasse 10?

Vektor partiell ableiten?