Web Scraping: Beautiful Soup oder Selenium/Scrapy?

1 Antwort

So wie ich das sehe, müsstest du lediglich prüfen, ob der Button auf der Webseite vorhanden ist, mit dem man das Produkt zum Warenkorb hinzufügen kann. Dieser hat die ID add-to-cart-button und wird schon mit dem ersten Response geliefert.

Mit scrapy sollte die Implementation am kürzesten und einfachsten sein.

Wenn du die BeautifulSoup-Bibliothek verwenden wolltest, müsstest du noch die requests-Bibliothek dazunehmen, um erst einmal den Response für die Produktseite zu erhalten.

Selenium lohnt sich erst (bzw. wird nur dann erforderlich), wenn du den Browser automatisiert steuern möchtest, weil Informationen bspw. nicht beim ersten HTTP Response zurückgegeben, sondern via JavaScript nachgeladen werden.


Carusla 
Fragesteller
 16.04.2022, 00:58

Das klingt solide, danke dir!

Darf ich dich mal kurz fragen, woher du dein ganzes Wissen hast mit nur 24 Stunden am Tag?

Ich stecke schon jede freie Minute rein, aber je mehr ich lerne, desto mehr wird es irgendwie?

0
regex9  16.04.2022, 01:17
@Carusla

Ja, es wird definitiv immer mehr, so entmutigend es auch klingt. Deswegen kann ich nur empfehlen, Fokuspunkte zu setzen, mit Präferenz darauf, was dich persönlich am meisten interessiert. Manche Themen muss man liegenlassen (wenn man sie braucht, hat das noch Zeit für später) oder kann sie nur anreißen.

Ich stecke einfach ziemlich tief im Bereich der Softwareentwicklung und nutze demzufolge viele Quellen (Blogartikel, Bücher, Newsseiten, andere Entwickler mit denen man sich ab und an austauscht, zahlreiche unterschiedliche Projekte, Videos von Vorträgen zu Thema XY, ...).

1