Frage von PythonFragen, 65

HTML Seite nach bestimmter Information mit Python auslesen?

Das ist meine URL: https://www.frag-caesar.de/lateinwoerterbuch/ridere-uebersetzung.html

Ich möchte aus dieser HTML Seite nur die Übersetzung der im Link angegeben Vokabel ridere erhalten.

Wie kann ich diese Seite am zuverlässigsten und am einfachsten nach der Übersetzung auslesen?

Antwort
von kingbongo, 38

Mit PHP und der Goutte Library ists Kinderkram https://github.com/FriendsOfPHP/Goutte

Hier der Code:

use Goutte\Client;
$crawler = (new Client())->request('GET', 'https://www.frag-caesar.de/lateinwoerterbuch/ridere-uebersetzung.html');

//tabelle auslesen
$nodeValues = $crawler->filter('.container > .table-responsive > tr > th')->each(function (Crawler $node, $i) {
return $items[] = $node->text();
});

for($i=1; $i<=count($nodeValues);$i++){
//in jeder 5ten Spalte pro Reihe ist die Übersetzung
if( !( $i % 5 ) ) print_r($nodeValues[$i]);
}



Kommentar von kingbongo ,

Für Python sollte es etwas ähnliches geben

Kommentar von PythonFragen ,

Mit PHP bin ich jetzt noch nicht in Kontakt getreten. Könntest du mir da erklären, was ich machen muss? Habe mein Programm ja in Python geschrieben.

Oder vielleicht eine einfache Alternative?

Kommentar von kingbongo ,

Sry, Python ist nicht meine Baustelle, hab es auch überlesen dass du nach Python gefragt hast...^^ es sollte aber sicherlich auch Webscraper Bibliotheken für Python geben, vielleicht gibts hier jemanden der etwas kennt.

Kommentar von kingbongo ,

Grad mal durch Github gesearched und ein Scraper für Py. gefunden .... https://github.com/scrapy/scrapy

Antwort
von carglassXD, 13

Keine passende Antwort gefunden?

Fragen Sie die Community