Als erstes brauchst Du Umgebungslicht (im Dunkeln kann man nichts sehen).
Als nächstes führt das Umgebungslicht dazu, dass die Oberfläche des - sagen wir Fußballs - Licht streut (Nicht die Reflexion führt zum Sichtbarmachen. Falls eine Oberfläche 100% reflektiert, sieht man die Oberfläche selbst nicht, nur das was sie spiegelt).
Von dem Fußball denkt man sich nun einzelne Lichtstrahlen die durch die Augenlinse auf die Netzhaut fallen: Der Fußball wird abgebildet. Das dürfte als Zeichnung in Deinem Physiklehrbuch und an vielen Stellen im Netz nachlesbar sein. Die 2-3 Strahlen, die eingezeichnet werden, erscheinen etwas willkürlich, sie reichen um die wesentlichen Effekte zu beschreiben, eigentlich sind es unendlich viele.
Es stimmt, das Bild entsteht verkehrt herum, was das Gehirn aber dankenswerterweise korrigiert. Auch ist es genaugenommen nicht nur die Linse, die optisch wirkt, sondern auch die Hornhaut mit der Flüssigkeit zwischen Hornhaut und Linse aber das führt wohl zu weit.
Dass die Netzhaut wie ein Kamerachip die Lichtsignale aufnehmen kann ist ein eigenes Wunder und die Repräsentation des Ganzen im Gehirn sowieso.