Wieso diese Speicherplatzdifferenz?
Ich habe zwei .docx-Dateien mit fast dem gleichen Inhalt. Sie unterscheiden sich nur durch die Anzahl der Zeichen von 207 267 zu 209 308. Diese besetzen 1,1 bzw. 7,2 MB Speicherplatz. Die paar Zeichen mehr machen das aber auch nicht aus, denn als beide Dateien noch gleich waren, bestand dieser Unterschied ebenfalls schon. Außerdem sind in der kleineren noch etwa 15 Bilder drin.
Wenn jemand schon jetzt eine Idee hat, wäre es mir recht. Wenn es nottut, könnte ich die Dateien auch hochladen.
Kleine Bitte: Ich möchte nicht darüber informiert werden, daß es jemand nicht weiß.
3 Antworten
Hallo,
Ja, so einfach ist das nicht. Bei Textverarbeitungen sind auch häufig noch nicht sichtbare Veränderungen gespeichert, damit man die aktuellen Arbeitsschritte rückgängig machen kann.
Ausserdem muss immer eine Mindestmenge an zusätzlichem Speicher hinzugefügt werden nicht die anzahl zusätzlicher Bytes sondern Cluster, eine bestimmte Anzahl an Sektoren, je nach Laufwerksgröße.
In Windows 10 können wir die folgenden Custergrößen verwenden
- 512 bytes
- 1024 bytes
- 2048 bytes
- 4096 bytes
- 8192 bytes
- 16 kilobytes
- 32 kilobytes
- 64 kilobytes
- 128 kilobytes
- 256 kilobytes
- 512 kilobytes
- 1024 kilobytes
- 2048 kilobytes
4096 Bytes ist die Standardoption
Diese Gegebenheiten muß man berücksichtigen. Da blickt meist nur word durch warum das so ist.
LG
Harry
Beide Dateien liegen im selben Verzeichnis(Clustergröße) und die größere hatte ich schon "nachverfolgungsbereinigt"
Die Clustergröße hat wenig Einfluss, denn nur der letzte Cluster einer Datei kann voll oder eben nicht voll sein. Alle anderen Cluster einer Datei sind immer voll, unabhängig von der Clustergröße.
bis 2TB ist die Clustergröße mindestens 4 kb
Standard-Clustergröße für NFTS, FAT und exFAT - Microsoft-Support
Normalerweise würde ich jetzt als Erstes vermuten, dass in der größeren Datei entweder eine Versionskontrolle aktiviert ist, oder alle Änderungen aufgezeichnet werden. Ohne das Dokument zu kennen, kann man das aber nicht prüfen.
Mit einem HexEditor könnte man beide Dateien vergleichen.
Was passiert, wenn Du beide Versionen mal als PDF speicherst?
Also dann fällt mir nur noch ein, beide Dateien mit einem Hex-Editor zu vergleichen, das ist aufwendig und mühsam, schon wegen der Größe. Es gibt sicher auch forensische Methoden, aber das ist auch nicht einfacher, zumal solche Werkzeuge kaum kostenlos sind.
Wenn selbst die PDFs so unterschiedlich bez. Größe, müssen ja inhaltlich Unterschiede da sein.
Noch ne Idee: Wenn das mit den Clustern zu tun hätte, könnten sie doch aber im Arbeitsspeicher gleich sein, oder?