Wie dynamische Webseiten auslesen?

Ich habe schon ein paar Sachen ausprobiert, z.b. requests mit beautifulsoup und den chromedriver, aber mit python und requests kann man keine Webseiten auslesen die dynamisch geladen werden und bei der chromedriver mit dem Browser erst die komplette Seite grafisch darstellt ist es viel zu langsam, was ist eine schnelle und effektive Lösung texte von internetseiten oder Kommentarsektionen auszulesen?

03.04.2022, 14:28

*Kommentartext

2 Antworten

MrCommandBlock

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Computer

03.04.2022, 14:30

bestenfalls nutzt man eine vorhandene API wie Youtube sie z.B. hat.

andernfalls wirst du nicht drumherum kommen einen "echten" browser im Headless laufen zu lassen. Das ist sehr ressourcenintensiv, aber mir ist keine andere Möglichkeit bekannt, zumal das JS ja auch interpretiert werden muss.

Serverseitige Node-Scripts laufen im prinziep auch einer kleinen Chromium version.

Woher ich das weiß:Hobby – Programmiere seit 2017 Webapplikationen

Mensch4

Beitragsersteller

03.04.2022, 14:33

Und welche ressourcensparenden automatisierbaren browser gibt es da?

MrCommandBlock

04.04.2022, 18:46

@Mensch4

Selenium

Browsershot

...

Du wirst aber pro instanz mit 100mb RAM rechnen müssen.

Mensch4

Beitragsersteller

04.04.2022, 20:58

@MrCommandBlock

das heißt ich könnte nur etwa 45 Instanzen laufen lassen?

MrCommandBlock

04.04.2022, 23:02

@Mensch4

naja muss es denn gleichzeitig sein?

weißt du überhaupt was du genau willst?

Du willst doch sicherlich nicht gleichzeitig 40 Seiten "auslesen"

Und wenn doch, dann musst du eben warten und Queuen, oder bessere Hardware anschaffen.

JS ausführen geht nicht umsonst.

Steffile

03.04.2022, 14:36

Selenium, oder wenn es um ecommerce geht, eScraper

Ähnliche Beiträge

Python Webseite auslesen (BeautifulSoup, Requests)?

Ich versuche gerade mit Python eine Webseite auszulesen (https://www.srf.ch/meteo/wetter/Zurich/47.3797,8.5342?geolocationNameId=1192045f06b811b701d8d7fcfd9dec64) und habe dazu eine Frage:

Wie kann ich einen Code schreiben, der je nach dem welches Symbol hier (siehe Bild) angezeigt wird, einen anderen Wert ausgibt. Z.B. 1 für Sonne, 2 für Wolke usw.

Könnte jemand einen konkreten Code schicken (mit BeautifulSoup, Requests usw)

Danke schon einmal im Voraus

...zum Beitrag

Webseiten Scraper in Python?

Ich würde gerne einen WebScraper programmieren, jedoch bekomme ich es nicht hin. Ich würde gerne von einer Webseite die Frequenz von unserem Stromnetz auslesen, bekomme aber als Ausgabe nur "None". Hier ist mein Python-Code:

from bs4 import BeautifulSoup

import requests, time

url = f'https://www.apg.at/de/markt/Markttransparenz/Netzregelung/Netzfrequenz'

page = requests.get(url)

soup = BeautifulSoup(page.content, 'html.parser')

table = soup.find('h3', attrs={'class':'mb-0 text-danger ng-tns-c64-1'})

print(table)

Ich habe vor 2 Stunden mit Python angefangen, habe aber bereits gute Kenntnisse in C++ und Java etc. Hat jemand eine Idee, wie ich das Problem lösen kann oder hat jemand bereits was ähnliches programmiert?

LG

...zum Beitrag

Ist es möglich, mit Python eine Webseite auszulesen?

Wenn ja wie? Braucht man dafür spezielle Module oder Programme? Wie hängt das mit HTML zusammen?

Auslesen meine ich:

Du gibst dem Programm eine Webseite von der es bestimmte Werte(z.b Preise oder Rechnungen) auslesen soll und dann halt irgendwo abspeichern in ner txt oder so

...zum Beitrag

JSON-Datei Inhalt in HTML Anzeigen?

Hallo Zusammen,

meine Webseite holt sich mit request genauer gesagt mit fetch-node eine JSON Datei von einem Server, soweit funktioniert das auch.

Nun weiß ich nicht genau wie kann ich nun den Inhalt aufteilen z.b. in Name, Titel, Beschreibung und diesen Grafisch in HTML darstellen ?

...zum Beitrag

Python dynamische Bilder downloaden?

Hallo, ich brauche tipps und informationen, wie ich von einer Webseite die ganzen Bilder runterladen kann, die auf "mehr anzeigen" sind oder beim runterscrollen neu laden?

...zum Beitrag

Verzeichnis einer Webseite auslesen?

Hi!

Ist es möglich (bzw. überhaupt legal) den Inhalt eines Verzeichnisses einer Webseite auszulesen?

Beispiel:

Ich möchte gerne wissen, welche Dateien unter

http://www.irgendwas.de/bla/

abgelegt sind.

Klar ist mir, dass wenn dort eine "index.htm" abgelegt ist, diese angezeigt wird.
Aber wenn keine index hinterlegt ist und ich z.B. wisssen möchte, welche Bilddateien in diesem Verzeichnis liegen; wie kann ich legal vorgehen?

...zum Beitrag

Website Daten auslesen und wiedergeben in Discord Python?

Wie kann ich von einer Webseite Produkte auslesen und sie dann in Discord wieder geben? Aber um an das Produkt zu kommen, muss man erst einmal dies in der Suchleiste auf der Webseite eingeben. Und das alles in der Sprache Python.

...zum Beitrag

PyScript als JavaScript Alternative?

Ich habe gesehen, dass es ein Python Framework gibt welches einem erlaubt Python als JavaScript Alternative zu benutzen um eine Webseite dynamisch zu gestalten. Was haltet ihr davon und würdet ihr es ihr es JavaScript vorziehen?

Link zu PyScript.

...zum Beitrag

Cookies mit Python auslesen?

Hey freunde, ich bin es mal wieder! ist es möglich cookies von besuchten websiten auszulesen?

...zum Beitrag

Python CSV Datei herunterladen und auslesen?

Hallo zusammen, folgende Problemstellung:

in meinem Unternehmen gibt es ein Python Skript (mit ACM Modul), welches eine Tabelle, die auf einer Internetseite zu finden ist, ausliest und die entsprechenden Werte zurückgibt. Es ist ein recht komplexes Skript, aber durch die Kommentare verstehe ich einigermaßen worum es geht (habe absolut keine Erfahrung mit Python). Nun wurde die Seite allerdings so verändert, dass man die Tabelle nun als csv herunterladen muss und diese nicht mehr "direkt" auf der Seite zu finden ist.

Kann mir jemand erklären, wie ich in Python eine CSV Datei von einer Webseite herunterladen kann und die dortigen Werte auslesen kann?

Und sorry, das Skript kann ich euch leider nicht zeigen, mir reicht allerdings schon eine grobe Antwort.

Danke im Voraus

Liebe Grüße

...zum Beitrag

onclick-event auf webseite mittels python triggern?

Hallo,

ich habe auf einer Webseite eine Tabelle mit verschiedenen Einträgen.
Wenn ich einen Eintrag anklicke, wird eine Funktion aufgerufen

<td onclick="handleRestart(1,3)">xxxxxxxx</td>

Diese Funktion (handleRestart) kann sehe ich auch im Quelltext.

function handleRestart(neu, idx) {
	if (!idx) idx = 1;
	if (neu > 0) {
		jQuery.getJSON( url + "&callback=?", {
			quizSelection: idx
		}, function( retVal ) {
		  quiz = retVal;
		  if (quiz.error && quiz.error == "forbidden") {
			  handleServerError();
		  }
		  quiz.fragenPointer = 0;
		  anzFalsch = 0;
			jQuery("#frageContainer").html(renderQuestion(quiz.fragen[quiz.fragenIds[quiz.fragenPointer]]));
		  renderStats();
	  });
	} else {
	  quiz.fragenPointer = 0;
		anzFalsch = 0;
		for (i= 0; i < quiz.fragenIds.length; i++) {
			quiz.fragen[quiz.fragenIds[i]].answer = -1;
		}
		jQuery("#frageContainer").html(renderQuestion(quiz.fragen[quiz.fragenIds[quiz.fragenPointer]]));
		renderStats();
	}
}

Gibt es eine Möglichkeit mittels Python die Seite aufzurufen und dann die Funktion aus dem Python-script zu triggern?

Mittels "requests" kann ich ja http-requests schicken. Aber gibt es auch eine möglichkeit, wenn ich die Seite geladen habe

z.B.

 r = requests.get('webseite')

die Funktion (handleRestart) zu triggern?

Es gäbe noch weiter Funktionen, die ich dann aufrufen möchte, aber das denke ich ist dann ähnlich.

Wenn ich in der Tabelle auf einen Eintrag klicke, bekomme ich ein Quiz.
Im Quelltext wird durch ein Funktionsaufruf eine .json geholt. Diese würde ich mir gerne ansehen und evtl. Daten rausholen. Ziel ist es alle Fragen des Quiz zu bekommen, ohne händisch durchzugehen und diese aufzuschreiben.

...zum Beitrag

Python wert auslesen?

Hallo bin noch nen ziemlicher Anfänger.

wäre es möglich z.B. einen sich veränderten Wert aus einem Programm wie Zoom oder Microsoft Teams oder so auszulesen und automatisch in ein Python script einbinden?

...zum Beitrag

Python XML-Dateien lesen?

Hallo,

Wie kann man in Python XML-Dateien lesen. Ich habe mir dafür schon ein paar Tutorials durchgelesen, aber bei dem das ich verwenden möchte sagt mein Python-Interpreter die ganze Zeit:

 File "C:\Users\toni-\source\repos\PythonApplication1\PythonApplication1\PythonApplication1.py", line 32, in <module>
  value = b_name.get('qty')
AttributeError: 'NoneType' object has no attribute 'get'

Wist ihr woran es liegt?

Hier das Tutorial:

Lesen und Schreiben von XML-Dateien in Python – Acervo Lima

Danke für eine Antwort

TheCPP

...zum Beitrag

Windows User passwort Auslesen?

hey Freunde! ich weiß nach dem Titel haltet ihr mich wahrscheinlich für einen Idioten, aber lasst mich erstmal ausreden. Ist es möglich Das Passwort von einem Admin/User als Admin auszulesen? müsste doch eigentlich möglich als Admin sein. Am besten mit python, cmd, batch, und vll einem 3Party Programm. LG Max

...zum Beitrag

Was möchtest Du wissen?

Deine Frage stellen