Wieso diese Speicherplatzdifferenz?

Ich habe zwei .docx-Dateien mit fast dem gleichen Inhalt. Sie unterscheiden sich nur durch die Anzahl der Zeichen von 207 267 zu 209 308. Diese besetzen 1,1 bzw. 7,2 MB Speicherplatz. Die paar Zeichen mehr machen das aber auch nicht aus, denn als beide Dateien noch gleich waren, bestand dieser Unterschied ebenfalls schon. Außerdem sind in der kleineren noch etwa 15 Bilder drin.

Wenn jemand schon jetzt eine Idee hat, wäre es mir recht. Wenn es nottut, könnte ich die Dateien auch hochladen.

Kleine Bitte: Ich möchte nicht darüber informiert werden, daß es jemand nicht weiß.

3 Antworten

heizfeld

15.10.2023, 16:35

Hallo,

Ja, so einfach ist das nicht. Bei Textverarbeitungen sind auch häufig noch nicht sichtbare Veränderungen gespeichert, damit man die aktuellen Arbeitsschritte rückgängig machen kann.

Ausserdem muss immer eine Mindestmenge an zusätzlichem Speicher hinzugefügt werden nicht die anzahl zusätzlicher Bytes sondern Cluster, eine bestimmte Anzahl an Sektoren, je nach Laufwerksgröße.

In Windows 10 können wir die folgenden Custergrößen verwenden

512 bytes
1024 bytes
2048 bytes
4096 bytes
8192 bytes
16 kilobytes
32 kilobytes
64 kilobytes
128 kilobytes
256 kilobytes
512 kilobytes
1024 kilobytes
2048 kilobytes

4096 Bytes ist die Standardoption

Diese Gegebenheiten muß man berücksichtigen. Da blickt meist nur word durch warum das so ist.

Harry

papi3

Fragesteller

15.10.2023, 16:37

Beide Dateien liegen im selben Verzeichnis(Clustergröße) und die größere hatte ich schon "nachverfolgungsbereinigt"

papi3

Fragesteller

15.10.2023, 16:40

Noch ne Idee: Wenn das mit den Clustern zu tun hätte, könnten sie doch aber im Arbeitsspeicher gleich sein, oder?

papi3

Fragesteller

15.10.2023, 16:46

@papi3

Mist! Grade nachgesehen: beide Speicher fast gleich

heizfeld

15.10.2023, 16:50

@papi3

Was genau sollen die Nachforschungen bewirken? Gibt es irgendwas zu gewinnen? Wenn es um speicherpltaz geht , man kann jede Datei komprimiert ablegen.

CatsEyes

15.10.2023, 17:10

@papi3

Cluster gibt's so im RAM nicht.

papi3

Fragesteller

15.10.2023, 22:00

@CatsEyes

Eben! Deshalb habe ich ja auch Platte und Speicher verglichen.

papi3

Fragesteller

15.10.2023, 22:02

@heizfeld

Wenn man was fragt, will man meist etwas wissen. Kennst du das so nicht?

CatsEyes

15.10.2023, 22:20

@papi3

Wenn Du mit Speicher RAM meinst, dann kann man das nicht vergleichen. Im RAM wird ganz sicher nie die komplette Datei geladen! Das kann man doch gar nicht vergleichen. Stell Dir mal vor, wie das z.B. mit einer 50GB-Videodatei wäre! 😉

papi3

Fragesteller

22.10.2023, 16:13

@CatsEyes

Wenn du auf "Datei--->Eigenschaften " gehst, kommt auch "Größe" und "Größe auf Datenträger". Das habe ich genommen.

CatsEyes

22.10.2023, 18:07

@papi3

Da kommt die Differenz wegen ev. Komprimierung, der NTFS-Formatierungsart und den versteckten Zusätze (Streams) zu Stande.

Diese Streams kann man sich z. B. hiermit anzeigen:

https://www.nirsoft.net/utils/alternate_data_streams.html

heizfeld

22.10.2023, 19:27

@CatsEyes

Die AUslagerungsdatei wird ja auch noch zur RAM Verlängerung einbezogen und das Speichermanagement von Windows ist wirklich vorbildlich und mit kaum Verzögerungen bei AUslagerung.

CatsEyes

22.10.2023, 19:46

@heizfeld

Das stimmt, hat aber mit der Anzeige der verschiedenen Dateigrößen im Explorer nichts zu tun.

CatsEyes

15.10.2023, 17:09

Die Clustergröße hat wenig Einfluss, denn nur der letzte Cluster einer Datei kann voll oder eben nicht voll sein. Alle anderen Cluster einer Datei sind immer voll, unabhängig von der Clustergröße.

heizfeld

15.10.2023, 17:11

@CatsEyes

Gut, aber bei Clustergröße 2048kb kannst du 2MB verbreuchen für ein Byte Info, wenn es am Ende ist. Und für eine Textdatei mit einemzeichen ebenfalls. Das fällt doch ins AUge, oder?

CatsEyes

15.10.2023, 17:16

@heizfeld

Das stimmt natürlich, aber den immensen Größenunterschied beider Dateien kann man so dennoch nicht erklären, weil ja ziemlich viele Cluster benötigt werden, und nur der letzte Einfluss auf die angezeigte Größenunterschiede hat.

CatsEyes

15.10.2023, 17:19

@heizfeld

So große Clustergrößen macht man üblicherweise auch nicht, bei Datenbankservern ja, das steigert das Tempo.

heizfeld

15.10.2023, 17:30

@CatsEyes

ja, überspitzt dargestellt natürlich...

heizfeld

15.10.2023, 17:38

@CatsEyes

bis 2TB ist die Clustergröße mindestens 4 kb

Standard-Clustergröße für NFTS, FAT und exFAT - Microsoft-Support

CatsEyes

15.10.2023, 17:42

@heizfeld

Das gibt bei den vom FS genannten Dateigrößen viele Cluster.

heizfeld

15.10.2023, 17:52

@CatsEyes

Ja, Dateigröße Modulus Clustergröße +1

evtldocha

Nutzer, der sehr aktiv auf gutefrage ist

im Thema Microsoft

15.10.2023, 16:41

Normalerweise würde ich jetzt als Erstes vermuten, dass in der größeren Datei entweder eine Versionskontrolle aktiviert ist, oder alle Änderungen aufgezeichnet werden. Ohne das Dokument zu kennen, kann man das aber nicht prüfen.

papi3

Fragesteller

15.10.2023, 16:47

Habe ich schon rausgeschmissen. War fast nichts.

CatsEyes

15.10.2023, 17:13

Mit einem HexEditor könnte man beide Dateien vergleichen.

Was passiert, wenn Du beide Versionen mal als PDF speicherst?

papi3

Fragesteller

15.10.2023, 22:08

Habs gerade probiert. Die kleine 1,8, die große 6,3

CatsEyes

15.10.2023, 22:21

@papi3

Und beide sehen inhaltlich gleich aus? Bilder in gleicher Auflösung usw.?

CatsEyes

15.10.2023, 22:33

@CatsEyes

Also dann fällt mir nur noch ein, beide Dateien mit einem Hex-Editor zu vergleichen, das ist aufwendig und mühsam, schon wegen der Größe. Es gibt sicher auch forensische Methoden, aber das ist auch nicht einfacher, zumal solche Werkzeuge kaum kostenlos sind.

Wenn selbst die PDFs so unterschiedlich bez. Größe, müssen ja inhaltlich Unterschiede da sein.