Frage von KnorxyThieus, 48

9 mal 40 GB-PDF-Dateien in alter Sicherung gefunden! Wie kann ich sie lesen, um zu überprüfen, ob sie noch verwertbar/relevant sind?

Hallo & ja, ihr habt richtig gelesen: 40 GB, in Worten vierzig Gigabyte. :O

Google Chrome ebenso wie Microsoft Edge stürzen (natürlich) ab, wenn ich eine der Dateien mit ihnen zu öffnen versuche. Nur mit dem Total Commander Lister kann ich in sie hineinblicken, doch was ich dort sehe, sagt mir wenig: Verweise auf Programmdateien, AppData-Unterverzeichnisse und DLLs, auf die ich mir allesamt gar keinen Reim machen kann, meine Hoffnung, ein wenig Klartext darin vorzufinden, wurde allerdings nicht erfüllt.

Zum Hochladen zwecks Vergleich auf Plattformen wie VirusTotal sind die Files natürlich viel zu groß, eine manuelle Eingabe des SHA256-Werts (u. a. bei Google) war ebenfalls nicht vom Erfolg gekrönt.

Was soll ich jetzt tun? Ich würde wirklich gerne über 300 GB Plattenspeicher freikriegen, aber blindlings Löschen behagt mir auch nicht so! ;-(

Mit freundlichen Grüßen,
KnorxThieus

Antwort
von netcx, 23

Es gibt Programme, mit denen man pdfs in einzelne Seiten/Dateien splitten kann. Ansonsten probiers mal mit dem pdfcreator oder pdfforge, vielleicht geht das damit. Ansonsten vielleicht ein script schreiben, es sollte eigentlich einige pdf libraries geben die sollten das teilweise laden des pdfs auch drauf haben.

Kommentar von KnorxyThieus ,

Hallo,

Danke für den Tipp mit Programmen, PDF Split and Merge scheint da ganz gut zu sein ... in meinem Fall lieferte es allerdings beim Auftrag, die ersten 10 Seiten auszuschneiden, eine ernüchternde einseitige PDF zurück.

Ich frage mich, ob es sich überhaupt um eine gültige bzw. echte PDF-Datei handelt, oder irgendeine Software diese Dateiendung missbraucht hat. Wie kann ich das testen?

Kommentar von netcx ,

http://stackoverflow.com/questions/3108201/detect-if-pdf-file-is-correct-header-...

Man kann scheinbar nicht ohne weiteres überprüfen, ob das file korrupt ist, aber man kann zumindest im header sehen ob es ein pdf file ist. ansonsten muss man gucken, ob es eine pdf library gibt, die da was in die richtung kann. genaues weiß ich leider auch nicht

Kommentar von KnorxyThieus ,

Oh, danke, es scheint so, als wenn zumindest der Header (im Lister steht "%PDF−1.X" am Dateianfang) korrekt sei.
Ich habe inzwischen raus, dass die Datei aus einer Datenrettung stammt - von Recuva, deswegen fehlt auch der Dateiname - und nicht unbedingt vollständig gültig sein muss. Aber welche PDF-Datei ist denn 40 GB groß? Und wie könnte ich sie in irgendeiner Form anzeigen, gibt es selektive PDF-Reader? Oder können diese Unmengen nur Schrott sein?

Keine passende Antwort gefunden?

Fragen Sie die Community