Wieso kann ich die Video URL nicht extrahieren?
Ich habe folgendes Programm für die Seite Vivo geschrieben, dies soll in erster Linie die url aus der Hauptseite extrahieren, da ich für den rest schon alles habe. Ich habe hierfür lxml benutzt, da bs4 keine xpaths unterstützt und ich keinen browser starten möchte also ist selenium auch raus. Das hier ist mein derzeitiger Code:
import requests
import lxml.html
mainurl = "https://vivo.sx/videoid"
html = requests.get(mainurl + "/")
doc = lxml.html.fromstring(html.content)
xpath1 = doc.xpath('//video/@src')
print(xpath1)
Ich bekomme aber nur "[]" zurück. wie kann ich mir den inhalt von //video/@src anzeigen lassen, da sich dort die videourl befindet.
Mfg Elias
1 Antwort
Die Inhalte werden doch bestimmt mit JavaScript erst später in die Seite geladen. Versuche es mit der requests-html-Bibliothek. Erst holst du dir den Response, dann renderst du diesen (wie das geht, wird auf der verlinkten Seite gezeigt) und parst daraufhin. XPath-Selektoren unterstützt die Bibliothek ebenso.