Website mit Python auslesen?
Hallo!
Ich würde gerne mit Python 3 alles Text einer Website auslesen.
Die Beispiele, die ich im Internet gefunden habe funktionieren, zeigen aber auch Text, den nicht einmal auf der Seite zu sehen ist. Zusätzlich wird mancher Text auf der Website gar nicht erst gefunden.
Ich brauche ein Program, was mir nur den Text gibt, den ich auch hätte, würde ich einfach alles Text auf der Seite Manuell kopieren.
1 Antwort
Das ist je nach Website gar nicht so ohne weiteres möglich. Viele Websites laden Ihre Inhalte erst nach dem initialen Seitenaufruf per AJAX nach. Um diese seiteneigenen Skripte auch ausführen zu können, brauchst du ggf. zusätzliche Bibliotheken wie PyQt5. Alternativ könntest du natürlich versuchen nur genau diese Anfrage mit Python nachzubilden. Aufschluss über die geladenen Ressourcen gibt dir das Netzwerktab deiner Browser-Entwicklertools.
https://pypi.org/project/PyQt5/
https://stackoverflow.com/questions/8049520/web-scraping-javascript-page-with-python