Darf man Seitenquelltexte abrufen und auslesen?

... komplette Frage anzeigen

7 Antworten

Wenn du eine Webseite betrittst, dann lädt dein Browser alles schon von allein herunter. Wenn der Betreiber das nicht wollte, müsste er dafür sorgen, dass es deinem Browser gar nicht erst zugeschickt wird.

Das heißt Herunterladen ist kein Problem.

Es kommt darauf an, was du damit vor hast. Für deine privaten Zwecke (Lesen, Lernen etc.) kannst du die Daten verwenden.

Wenn es aber darüber hinausgeht und du eine "Verwertung" dieser Informationen anstrebst, dann hängt es sehr davon ab, um welche Inhalte es sich handelt und in welcher Form diese bereitgestellt wurden. Im Allgemeinen fällt dies unter das Urheberrecht.

Bilder und sonstiges geistiges Eigentum darfst du nur mit dem Einverständnis des Urhebers verwerten.

Quellcode 1:1 übernehmen um damit ein anderes Produkt herzustellen (möglicherweise sogar kommerziell) bedarf ebenfalls des Einverständnisses des Urhebers, wenn dieser den Code nicht unter eine Lizenz gestellt hat, die dir die Verwendung ohne explizite Erlaubnis gestattet.

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von Crysali
31.10.2016, 19:17

Vielen Dank! Ich habe vor, mir zu Übungszwecken ein kleines Programm zu schreiben, dass mir Seitenquelltexte von verschiedenen Seiten abruft und Informationen filtert.

Wenn ich das mit einem Programm mache ( stream ist die Methode, glaube ich), unterscheidet sich der Abruf dann im Vergleich zum Benutzen eines Browsers ? Da wird ja meine ich noch ein Userheader oder so ähnlich mitgeschickt, was würde dann das Programm im Hintergrund mitschicken ? Würde das Programm meinen Browser benutzen ?

0

Kommt drauf an, wenn das nur vereinzelte Abfragen sind dürfte das kein Problem sein (also in "normalem" Maße halt, wie das ein durchschnittlicher User auch machen würde). 

Willst du aber regelmäßig z.B. mehrere 100 oder gar tausende Seiten pro Tag abrufen, dann solltest du dich auf jeden Fall beim Betreiber der betreffenden Seite informieren ob du das darfst (viele größere Seiten, z.B. auch YouTube, bieten für solche Zwecke übrigens sogar spezielle APIs, das ist komfortabler für den, der die Daten abfragt und spart den Betreiber ggf einiges an Traffic (weil eben nur die eigentlichen Daten ausgegeben werden und nicht das ganze "drumherum" wie HTML, Bilder etc)).

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von Crysali
31.10.2016, 19:21

Ahhh, ich verstehe. Kennst du zufälligerweise genaues Maß für die Anzahl der Abrufe pro Tag ? Mein Programm wird auf Seiten zugreifen, die sehr viele vernetzte Artikel haben und ich glaube, ich muss dann immer wieder neuen Quellcode abrufen ( habe mich in das Thema noch nicht eingearbeitet). Da könnten locker 250 Abrufe pro Session zusammenkommen. Ich werde mal schauen, ob die Seiten API anbieten, danke!

0
Kommentar von DreiGegengifts
31.10.2016, 19:36

dann solltest du dich auf jeden Fall beim Betreiber der betreffenden Seite informieren ob du das darfst

Dürfen darf er. Denn eine Serverüberlastung muss schon mutwillig erfolgen. Doch eine Serverüberlastung ist gar nicht möglich, wenn man nur einen Rechner zur Verfügung hat.

0

Darf man Seitenquelltexte abrufen und auslesen?

Selbstverständlich. Das machst du übrigens automatisch mit jedem Seitenaufruf z.B. im Browser.

Alles was eine Webseite an dich sendet ist auch für dich bestimmt. Diese Informationen kannst du ansehen oder auch automatisch verarbeiten.

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von Crysali
31.10.2016, 19:14

Habe ich mir auch gedacht, aber einen Seitenquelltext rufe ich im Programm auf, um etwas damit zu machen, um Informationen daraus zu filtern. Das mache ich zwar auch, wenn ich mir eine Seite anschaue, aber ich denke, bei Programmierung ist das dann möglicherweise noch etwas komplizierter, je nach Art der abgerufenen Information.

0

Solange du den server nicht mit anfragen überflutest und keine urheberrechtlich geschützten materialien klaust oder gegen gesetze verstösst oder musik etc ohne lizenz vertreibst juckts niemanden xd

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von Crysali
31.10.2016, 19:23

Danke, hatte mich etwas irritiert, da im Seitenquelltext ja einiges drin ist, je nach Seite. Gut das geklärt zu haben, danke :)

0
Kommentar von LeonardM
31.10.2016, 19:27

da befindet sich ja nur der output vom serverseitigen und nicht das Serverseitige selbst. da steht nur was der besucher jetzt tatsächlich auch angezeigt bekommt 1:1 drinnen

1

Nein, du solltest den Betreiber der Seite vorher um Erlaubnis fragen. Viele Anbieter verbieten die Weiterverarbeitung aber auch explizit in ihren AGB.

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von Crysali
31.10.2016, 19:08

Danke, war mir echt nicht sicher, weil teilweise auch Sachen abgerufen werden, die copyrighted sind und Ähnliches. Werde die  AGB anschauen, danke!

0

Aeh nein. Ich kann dir jetzt keine Page zum nachlesen sagen, ich weiss aber, dass es ein Urteil hinsichtlich einer einfachen Einbindung auf Webseite A zu einem Pic von Website B gab. Also "http://XXXX/bla.jpg". Das Einzelbild wurde derart oft aufgerufen, dass der Betreiber B den Betreiber A wegen einer Art "Trafficdiebstahl" - Also unabhängig vom Urheberrecht oder inhaltlichen, rein wegen Traffickosten angelehnt an die Vorgaben des Hosters - verklagt hat und Recht bekommen hat. Von daher: Serverbetreiber fragen oder AGB genau nachlesen. 

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von DreiGegengifts
31.10.2016, 19:38

Falsche Baustelle. Und was in den AGBs steht ist irrelevant.

0

Klar darf man das. Genau so beschaffen Suchmaschinen wie Google ihre Daten. . . 

Antwort bewerten Vielen Dank für Deine Bewertung

Was möchtest Du wissen?