Forward Pass in Neuronalen Netzen?

Hey,

Ich habe gerade etwas Probleme den Forward Pass in neuronalen Netzen zu verstehen. Kann mir jemand sagen, warum mein Dozent alle Gewichtsmatrizen transponiert? Bzw woher weiß ich, ob ich die Gewichte transponieren muss? Hier ist die Rechnung:

Bild zum Beitrag

1 Antwort

R4c1ngCube

15.07.2025, 18:16

Das ist eigentlich komplett arbiträr. Man könnte die Einträge in der Matrix auch einfach anders anordnen. Wichtig ist nur, was mit was verrechnet wird.

Aber die gegebene Schreibweise entspricht einer Konvention die denke ich folgenden Ursprung hat. Für zwei Spaltenvektoren (also vertikale) x, w (also ein einzelnes Perzeptron, mit seinen Gewichten im Vektor w und dem Input x):

x * w^T ist ein Skalarprodukt. Das ist was du willst, denn du willst ja w1 * x1 + w2 * x2 etc.

wenn du w jetzt zu mehreren Vektoren erweitern willst, um mehrere Skalarprodukte gleichzeitig zu berechnen (eines pro output Neuron / Perzeptron), machst du das natürlich in der Dimension die noch nicht verwendet wird. Bei Spaltenvektoren also in den Zeilen.

Du hast jetzt also pro Zeile die Gewichte für jeweils ein (output)-Perzeptron.

Matrix-Multiplikation ist aber Zeile * Spalte. Die Zeile ist dein (x1, x2), also muss deine Spalte w1, w2, w3, ... sein, welche aber durch vorherige Erweiterung in den Zeilen stehen. Du musst also für eine korrekte Rechnung transponieren.

x * W^T

Dieses Konzept, dass die Rechnungen gleich bleiben wenn man z.B. einen 1D-Vektor zu der 2D-Matrix oder einem 3D Tensor macht sieht man übrigens sehr häufig.

---

Eine andere Sichtweise: Du hast pro Layer pro Output-Neuron jeweils ein Gewicht. In der Reihenfolge legst du sozusagen die Dimensionen fest.

Layer: Wahl durch Wahl der Matrix
Output Neuron: Wahl durch erste Dimension (Bei Matrix ist das die Zeile)
Gewichte: Wahl durch zweite Dimension (Bei Matrix ist das die Spalte)

Wenn du auch über den gesamten Datensatz vektorisierst:

Layer: Wahl des Tensors, Sample: erste Dimension, Output Neuron: zweite Dimension, Zugehörige Gewichte: dritte Dimension

Forward Pass in Neuronalen Netzen?

1 Antwort

Bias in Neuronalen Netzen?

Was bedeutet "Rt" im Zusammenhang mit transponieren?

Noten Transponieren von B zu C

Was haltet ihr vom LLM Hype?

Was denkt ihr: Werden Künstliche Intelligenzen mehr Vorteile oder Risiken bringen?

Hab ich Deep Learning so richtig verstanden?

KI wie funktioniert das eigentlich?

Hilfe bei Rechnung in Stöchiometrie (Chemie)? Aufgabe 3 b)

Tinder automatisieren?

Ist künstliche Intelligenz gut oder schlecht für die Menschheit?

Was haltet ihr von Bildern, die von einer KI generiert wurden?

Nutzt du die „Künstliche Intelligenz“?

Woher weiß ich vor welchen Ton ich beim transponieren ein Vorzeichen setzen muss?

Stimmen klonen mit KI? Welches Programm ist da empfehlenswert?