Beste Methode um Daten von Webseiten auszulesen (Java,Android)?

4 Antworten

Nun die beste Alternative ist natürlich dafür zur Verfügung gestellte Schnittstellen (z.B. intrinio, Yahoo und Google hatten glaube ich kostenlose Dienste die eingestellt wurden, keine Ahnung ob es da nun noch andere gibt) zu nutzen, welche dir bereits die Rohdaten liefern. Je nach Menge und Frequenz kostet das natürlich etwas, sprich zum Spielen oder für sich persönlich durchaus möglich. Als kommerzielle App eher nicht. Dafür können die anderen dir natürlich auf die Finger hauen oder gar rechtliche Schritte einleiten, ist dann ne Grauzone. Ansonsten ist das bei Android nix anderes, zumal du da ja mit Java arbeiten kannst und das erstmal nix mit der Darstellung oder der Eingabe zutun hat, die Android spezifisch wäre.

Allgemein läuft das unter den Begriffen "scraping", "spider" und "crawler". Es geht mit jeder Programmiersprache, in der eigene HTTP-Clients zur Verfügung stehen. Ich mache es gelegentlich mit Perl unter Linux. In Perl gibt es mehrere verschiedene Module dafür. Auch in Python geht es.

http://shop.oreilly.com/product/0636920078067.do

Wenn ich es nun in einer Android-Umgebung machen müßte, würde ich versuchen, auf dem Gerät Termux zum Laufen zu bekommen (ein Mini-Linux in einer Android-App)...

https://www.heise.de/download/product/termux-app

https://wiki.termux.com/wiki/Main_Page

...und es dann in einer der dort verfügbaren Sprachen programmieren.

https://wiki.termux.com/wiki/Development_Environments

Da ist am PC und Android das Selbe.

Du solltest dir anschauen, wie die Daten vorliegen und anhand dessen entscheiden, wie du sie auslesen möchtest.

Was möchtest Du wissen?