Kann ich eine Suchmaschine wie google selbst erstellen?

7 Antworten

Es ist natürlich theoretisch möglich. Aber der Aufwand ist enorm - insbesondere wenn man sieht wie weit es nach oben skalieren kann.

Fangen wir mal im kleinen an. Du hast eine Textdatei und willst darin was suchen. Gut...erstmal einfach. Jetzt kommt eine andere Datei (HTML/PDF/DOC/...) - macht die Sache schon komplizierter - aber noch machbar.

Nun aber: Du willst eine Ordnerstruktur durchsuchen. Schonmal die Windowssuche benutzt? Das kann ewig dauern und die Ergebnisse sind nicht besonders durchschaubar. Da muss man indizieren also schon (plump gesagt) im Hintergrund relevante Metadaten sammeln (und auch sinnvoll abspeichern) damit die schnell verfügbar sind. Das alleine ist schon eine Aufgabenstellung die ich mir nicht zutrauen würde wirklich gut umsetzen zu können (und ich bin nebenbei von meinen Fähigkeiten sehr überzeugt). Also da ist schon sehr viel Algorithmenmagie notwendig.

Du brauchst Schlüsselworte um die Suche zu präzisieren. Zugegeben, das ist eine der einfacheren Aufgaben. Praktisch trotzdem ein riesen Aufwand.

Was google noch kann...Ähnlichkeiten erkennen...nun vllt nicht etwas was man Anfangs haben muss - aber erwähnenswert.

Nun aber der Coup de grâce: Du beschränkst das nicht auf deinen PC, nicht auf ein lokales Netzwerk, sondern es soll das WWW umschließen. Und während alles zuvor mehr oder weniger auf deine Fähigkeiten und Zeit beschränkt ist (wobei ich überzeugt bin, dass sich das mit einem Menschenleben nicht erreichen lässt) - bist du hier auch Rechenpower angewiesen. Gehen wir einen Schritt hoch: indizieren. Das heißt regelmäßig alle Seiten abfragen die es gibt und die Daten abspeichern...viel Spass.

Ich gebe zu: Ein interessantes Gedankenexperiment. Und durchaus auch eine interessante Projektidee eine lokale Dateisuche zu implementieren - aber darüber hinaus für eine Einzelperson absolut unrealistisch....

Also, das funktioniert.
Du müsstest unglaublich viele "Roboter"- pc's programmieren (Sogenannte Webcrawler) die dann Das Internet nach Seiten und deren Inhalte durchsuchen. Dann brauchst du noch genügend Server die Diese Daten speichern und diese dann für die Internetseite grafisch wieder herausgeben.

Alles in allem, wenn du eine erfolgreiche grosse Suchmaschiene haben willst dann musst du sehr viel in Hardware investieren. Willst du das nur für eine Seite machen, z.B. in deine eigene Website integrieren, so hat Google extra ein Plugin das man kostenlos auf seiner Seite platzieren kann. Es gibt auch andere Hersteller die sowas haben... das wäre eine viel smartere Lösung.

Vom Prinzip her klar, sonst gäbe es kein Google, Yahoo, Bing und so weiter :D

Was möchtest Du wissen?