Informatik

1.140 Mitglieder, 5.051 Beiträge

Mini-Batch Gradient Descent - Wie wird richtig gemittelt?

Hey, ich muss als Übungsaufgabe ein einfaches Feed Forward Neural Network mit numpy implementieren. Das läuft jetzt auch schon ganz gut, jedoch bekomme ich noch immer leicht abweichende Ergebnisse zur Referenz, die sich durch eine andere effektive Learning Rate erklären ließen. Dafür habe ich das Mitteln der Mini-Batches in Verdacht. Grobe Struktur des aktuellen Netzwerkes: Es gibt einen Forward-Pass mit einem Mini-Batch, jeder Layer speichert die entsprechenden Inputs Es gibt einen Backward-Pass mit dem MSE über dem Mini-Batch, jeder Layer speichert die Gradienten Die Weights & Biases werden mit den gespeicherten Inputs & Gradienten geupdated Da die Inputs/Gradienten aus einem Mini-Batch entstanden sind, haben sie noch eine Dimension in der Batch Size, welche ich irgendwie loswerden muss. Nutze ich dafür jetzt die Summe oder das arithmetische Mittel, um ein einziges Update aus dem Batch zu bekommen? Im Endeffekt beeinflusst die Division durch die Batch Size ja die effektive Learning Rate. Einerseits würde ich das arithmetische Mittel nehmen, damit die Updates unabhängig von der Batch Size sind. Oder ist das doppelt gemoppelt und das Mitteln über den Loss des Batches reicht bereits, um die Batch Size auszugleichen?

Mathematik im Informatik Studium?

Ich will später was im Bereich Informatik studieren und ich bin nicht besonders gut in mathe was sollte ich mir im vorhinein beibringen ich will in die richtung künstliche intelligenz gehen also machine learning was muss ich wissen und können. zum Beispiel hab ich vor ein paar monaten schon mit der programmierung in python begonnen damit ich es da nicht so schwer hab und ich hab vor noch dieses jahr mich in die mathe themen einzuarbeiten

Hat die Ausbildung einen Einfluss auf die Jobsuche nach Informatik Studium?

Ich selber habe den produktionmechaniker mit verkürzten zweitausbildung zum polymechaniker/industriemechaniker gelernt (in der schweiz), würde jedoch lieber einen informatik studium absolvieren. Nur bin ich momentan unsicher ob ich mit diesem umweg trotzdem in den meisten IT Firmen und IT Stellen arbeiten könnte bzw. man welche die eine informatik grundausbildung absolviert haben bevorzugen würde. Hat da jemand erfahrungen gemacht oder einen ähnlichen weg eingeschlagen?

Cisco Packet Tracer . Netztopologie IPv4 Adressen herausfinden?

Hi Zusammen, ich arbeite gerade einer der dargestellten Netztopologie und habe auch nur die Angaben zu der Netzadresse aus der Topologie. Wie schaffe ich das nun auf die IP-Adressen aller Geräte zu kommen. Zur Info. Ich kann nur auf die Geräte User-4, Sw1 und Remote-Site1 zugreifen. Somit auch nur die IOS ( Konsole) dieser Geräte aufrufen um dort Befehle auszugeben. Jemand eine Hilfe für mich ?
Bild zum Beitrag

eigenen cursor beim hovering über Bild HTML?

Hallo, ich fange gerade an HTML zu lernen. Jetzt möchte ich folgendes tun: ich möchte, dass sich der Cursor in eine Schere verwandelt, wenn mit dem Mauszeiger über ein Bild gefahren wird. Ich habe also eine Klasse für das Bild kreiert und für diese in css festgelegt, dass der cursor sich über dem Bild in das PNG der Schere verwandelt, das ich in meinem Image Ordner abgelegt habe. html: <div class="zusammen"> <img src="img/zusammen.png"> </div> css: .zusammen{ cursor: url(img/schere.png), pointer; } Der curser "schere.png" ist auf jeden Fall im "img"-Ordner und ich habe die Größe des PNGs auf 32x32 pixel gesetzt. Wenn ich über das Bild fahre wird dennoch der "pointer" verwendet... Ich habe schon versucht andere pngs und svgs als Cursor zu verwenden, aber nichts funktioniert. Ich verwende Safari. Hat jemand eine Idee wo der Fehler liegt?

KI Chatbot für Support auf Webseite?

Ein Kunde von uns möchte einen Support KI Bot auf seiner Webseite haben, wir hatten schon einen Bot von einem Anbieter (Chatbase) im Test. Dort war das Charakterlimit der Dokumente leider zu niedrig. Jetzt sind wir grade dabei einen Bot bei VoiceFlow zu erstellen, wo es auch einige Probleme mit der Knowledgebase gibt. Jetzt ist die Frage gibt es gut oder bessere Anbieter eines KI-Chatbots wo man eigene Daten hochladen und diesen Individuell erstellen kann, wo der Preis auch nicht überdimensional hoch ist?

Code in C++ auslagern?

Schönen guten Abend zusammen. Ich lerne gerade c++ und bin quasi von Python umgestiegen bzw. lerne es ergänzend für die Arbeit. Ich habe eigentlich eine simple Frage: und bin ich es von Python gewöhnt Funktionen und/oder Klassen in separate "Module" (.py-Dateien) auszulagern um den Code schön übersichtlich und pflegeleicht zu halten. In c++ habe ich angefangen als kleine Übung mehrere Funktionen zu schreiben die verschiedene physikalische/mechanische Größen ausrechnen sollen (wie bspw. kinetische Energie). Diese Funktionsdefinitionen habe ich lediglich in eine .h Datei ausgelagert und anschließend in meine main.cpp #includiert was auch super funktioniert. Nun frage ich mich, warum es in einigen Erklärungen heißt bzw. gezeigt wird wie man den Code auszulagern hat, dass man sowohl eine .cpp als auch eine .h Datei erstellen soll, hingegen es bei mir lediglich mit einer .h Datei funktioniert. PS: Falls es relevant ist, ich arbeite mit Visual Studio 2022 Schon mal vielen Dank im voraus :))