3

An die Linux Profis!

Frage von Flo2oo8 Flo2oo8

Nabend!

Ich möchte ganz gerne mit Linux einen Vorgang automatisieren.

Und zwar habe ich einen Ordner mit knapp 10.000 html Datein, aus denen ich von jeder Datei einen bestimmten Link untereinander in eine TXT Datei kopiert haben möchte.

Das per hand zu machen würde ewig dauern, deshalb suche ich nach einer guten Möglichkeit, dies automatisch zu machen.

Hoffe mir kann jemand helfen.

Fragen zu gleichen Themen finden

Antworten (2)

  • 4
    Antwort von Whitefall Whitefall

    Kommt darauf an wo und wie der Link in den html-Dateien vorkommt, aber wahrscheinlich ungefähr so:

    find . -name "*.html" | xargs grep irgendwas | sed irgendwie > datei.txt

    Kommentar von Flo2oo8 Flo2oo8Flo2oo8

    Also damit kann ich recht wenig anfangen, sorry :)

  • 2
    Antwort von possel possel

    Hallo,

    hier noch der schnelle Hack in Perl aus den Possel-Labors, als dingsbums.pl speichern und mal loslaufen lassen. Alles ohne Gewähr....

    Cheers Possel

    -- Schnipp -------------------------

    #!/usr/bin/perl -w

    $/ = undef; # Dateien am Stück laden

    open (OUT, ">links.txt") or die $!;

    foreach $f (glob (".htm")) { (open IN, "<$f") or die $!;

    print &quot;Verarbeite $f...\n&quot;;
    
    my $content = &lt;IN&gt;;
    close IN;
    
    foreach ($content =~ m/&lt;a href=&quot;(.*?)&quot;/gi)
      {
        print OUT &quot;Link: $1\n&quot;;
      }
    

    }

    close OUT;

    -- Schnipp -------------------------

    Kommentar von possel posselpossel

    Da hat wohl GF die Formatierung geschreddert, hoffe, Du kriegst's auch so zum Laufen... halt alle HTML-Entities durch die "richtigen" Zeichen ersetzen :-]

    Kommentar von Flo2oo8 Flo2oo8Flo2oo8

    Also so wie's da steht hat es nicht funktioniert, kamen lauter Fehlermeldungen.

    Leider ich noch nich so viel Ahnung von Linux, sodass ich nicht weiss, was in dem Code HTML-Entities sind.

    Kommentar von possel posselpossel

    Hm nein hat gar nix mit Linux zu tun, GF macht nur manchmal aus "Gänsefuss" Brezel-quot-Semikolon, dito Brezel-lt-Semikolon sollte ein "kleiner" Zeichen sein!

    Cheers Possel

    Kommentar von harveyoswaldt harveyoswaldtharveyoswaldt

    possel, zeigs ihm doch auf Nopaste: http://paste.ubuntuusers.de/ dann ist Ende mit dem Zeichensalat.

Diese Frage

Verwandte Fragen

Noch nicht den richtigen Rat gefunden?

Einfach und schnell viele hilfreiche Ratschläge von Deutschlands aktivster Ratgeber-Community erhalten!

Einfach und schnell einen Tipp erstellen und Ihren guten Rat mit anderen teilen!

Einfach und schnell ein Video hochladen und anschaulichen Rat an alle geben!

Die unter gutefrage.net angebotenen Dienste und Ratgeber Inhalte werden nicht geprüft. Die Richtigkeit der Inhalte wird nicht gewährleistet. Rechtliche Hinweise finden Sie hier.