Gibt es irgendwo eine Top 1.000 Liste der am meist besuchten Webseiten der Welt?
Ich brauche für ein Projekt "Im besten Fall" eine Top 1.000 Liste der am meist betuchtesten Webseiten der Welt, mit:
URL und Name als CSV oder JSON oder grundsätzlich als Liste.
Habt Ihr da eine Idee wo ich etwas derartiges herbeiziehen könnte?
Gibt es eventuell sogar eine API dazu?
2 Antworten
Amazon hat den Kram immer veröffentlich über Alexa (also nicht der Sprachassistent Echo). Sind halt nur eine Million statt der Top 1.000 :D
Service ist zwar quasi abgestellt aber man kann immer noch die aktuellen Rankings runterladen:
http://s3.amazonaws.com/alexa-static/top-1m.csv.zip
Brauchst halt was backendseitiges, damit du es entzippen kannst aber sowohl Node, als auch Python, .NET, PHP oder jedes andere Backend sollte dafür Möglichkeiten bieten.
FUCK DU BIST MEIN HIRO!!!! Genau das habe ich gesucht. Alexa war mein erster Ansatz, zu dumm das der Service offline ist. Gibt es noch irgend welche Ressourcen zum alten Bestand? Etwa die Webseiten mit Kategorieangabe e.c. ?
Ich bin 100% sicher das die den Namen/ die Domain für den Sprachassistent künftig nutzen werden
Vielleicht sogar eine direkte Konkurrenz zur Google Suchmaschine?
Frag die Betreiber.
Oder nimm das HTML - ist ja auch nichts anderes, als XML mit Extras. Es gibt Frameworks, die das mit CSS-Selektoren absuchen, oder Du verwendest XPath, auch dafür gibt's Frameworks.
Aber Vorsicht: Wenn das kommerziell sein soll, frag trotzdem nach, kann sein, dass Du dich damit strafbar machst.
Und wie kann man da eine CSV Datei daraus generieren? Von solchen Diensten gibt es hunderte, aber ich brauche die Meta- Daten