Welches Dateiformat ist das sicherste für die Langzeitarchivierung einer Textdatei, PDF?

7 Antworten

An sich ist das Dateiformat sekundär, wichtiger ist, Backups zu haben.

Einerseits ist das Format völlig egal, wenn die Datei ausversehen gelöscht oder der Datenträger funktionsunfähig wird. Andererseits ist es egal, was mit der Datei passiert, solange man noch ein, oder besser zwei Backups hat.

PDF-Dateien haben die Eigenschaft, dass sie nicht ohne weiteres bearbeitbar sind, bzw. auch schreibgeschützt werden können. Zudem unterstützen sie sämtliche Formatierungen, unterschiedliche Schriftarten uvm., falls diese notwendig sein sollten.

Der PDF-A Standard wurde speziell für die Langzeitarchivierung entwickelt.

Wenn es um den reinen Text geht, macht auch eine reine Textdatei Sinn, vor allem, was den Speicherplatz betrifft. Hier hat man aber außer Umbrüchen praktisch keine Formatierungsoptionen. Zudem lassen sich die Dateien schnell und einfach bearbeiten.

Eine Zwischenlösung, falls Formatierungen notwendig sind, könnten Markdown-Dateien sein. An sich sind es reine Textdateien, aber mit bestimmten Zeichenfolgen können hier Formatierungen wie Überschriften oder Listen gekennzeichnet werden, die von einem geeigneten Programm auch entsprechend dargestellt werden.

Aber, und man kann es nicht oft genug sagen, das A und O bleiben die Backups. Am besten mindestens ein Backup auf einer anderen Festplatte, und ein Backup an einem anderen Ort (dafür eignen sich auch Web-Speicher) sollte man haben, wenn die Daten wichtig sind. Jede Festplatte kann ohne Vorwarnung kaputtgehen. Zudem können sie auch durch externe Katastrophen wie Feuer oder Wasser unvorhergesehen zerstört werden (weshalb man eben ein Backup an einem anderen Ort haben sollte).

Das Problem der Langzeitspeicherung hat mehrere Teilprobleme:

  • was passiert, wenn einzelne Bits ausfallen?
  • inwieweit ist die Datei an ein bestimmtes Betriebssystem bzw. spezielle Programme und Programmversionen gebunden, um geöffnet werden zu können?
  • Inwiefern können Dateistrukturen plattform-, zeit- und programmübergreifend erhalten werden?
  • inwiefern kann die Datei editiert werden, auch wenn sich die Technik stark weiterentwickelt hat und alte Programme nicht mehr zur Verfügung stehen?

Um speziell die genannten Anforderungen zu erfüllen, wurde das Format xml entwickelt, das daher für die Langzeitspeicherung besonders geeignet ist.

Ich würde wichtige Dateien immer im Originalformat und als PDF/A oder Textdatei / Markdown sichern. Ich erzeuge aus dem Original sowieso aber vor der Weitergabe auch fast immer PDF zum versenden, alleine schon, um einen Nachweis zu haben.

Sind im Originalformat nämlich irgendwelche automatisch aktualisierenden Elemente (z.B. \totay in LaTeX, Datumsfeld in Word) werden diese ggf. beim nächsten Öffnen aktualisiert und ich habe keine Kopie des versandten Originals ohne die PDF-Konvertierung.

Sollte man die Datei später mal wieder als Vorlage für etwas Anderes etc. benötigen, macht es Sinn, diese Bearbeitbar zu haben, deswegen zusätzlich im Originalformat.

Das Originalformat hat auch den Nachteil, dass man auch noch eine Software braucht, die das Lesen kann. Ich habe zum Beispiel noch archivierte Dokumente im AmiPro Format, die ich heutzutage nicht mehr auf bekomme.

Ireeb kann ich nur zustimmen, man muss die Dateien natürlich auch noch haben und deshalb ein gutes Backup haben. Heutzutage nicht mehr so relevant wie früher, man sollte die Backups auch regelmäßig hinsichtlich der Medien prüfen und ggf. auf aktuellere Medien umstellen. Habe ich auch bei einigen erst zu spät gemerkt, das Daten auf 5.25" Floppys, ZIP-Disks, gebrannten CDs/DVDs und IDE Festplatten keine gute Idee sind, wenn man die mangels Hardware oder Versagen des Datenträgers nicht mehr lesen kann.

Woher ich das weiß:Berufserfahrung – Softwareentwickler & Admin

Um Dokumente zu archivieren wird auch heute noch das verwendet: https://de.wikipedia.org/wiki/Mikroform Der Vorteil daran ist das es technologieunabhängig ist. Bei der digitalen Archivierung besteht die Gefahr von digitaler Obsoleszenz. Egal in welchem Format sich die Daten befinden.

rein technisch ist die stink normale Textdatei .txt die beste Aufbewahrung. Wenn bei der PDF auch nur ein Byte sich ändert, kannst du die schon nicht mehr verwenden.

Eine txt Datei kannst du immer noch mit nem HexEditor auslesen und alle Zeichen sind dort noch lesbar. Wobei sich die Text Datei auch mit nem regulären Text Editor öffnen lässt.

Hier ein Beispiel

Das habe ich in die Text Datei geschrieben

Bild zum Beitrag

Im HexEditor sieht das so aus

Bild zum Beitrag

Ich habe dann den ersten Byte geändert

Bild zum Beitrag

Im Text Editor sah es dann so aus

Bild zum Beitrag

So, nun habe ich das ganze mit der PDF gemacht. Ich habe die Text Datei als PDF gespeichert und dort den ersten Byte geändert.

So sah es davor aus

Bild zum Beitrag

Bild zum Beitrag

So danach

Bild zum Beitrag

Bild zum Beitrag

Wie du sehen kannst, die PDF lies sich nicht mehr öffnen. Der Text Datei ist das egal, da dort nur der Text gespeichert wird. In der PDF wird der Text komprimiert und daher ist dieser nicht mehr lesbar.

Also, wenn du puren Text speichern willst, mach es als reine Text Datei.

 - (Computer, PC, programmieren)  - (Computer, PC, programmieren)  - (Computer, PC, programmieren)  - (Computer, PC, programmieren)  - (Computer, PC, programmieren)  - (Computer, PC, programmieren)  - (Computer, PC, programmieren)  - (Computer, PC, programmieren)