Wie kann es seien das der Inhalt einer ZIP Datei größer ist als die Datei selber?
Ich habe letztens eine ZIP Datei die 4,5 GB groß ist. Als ich aber die ZIP Datei entpackt habe war der entpackte Ordner genau 5,12 GB groß. Wie geht das?
Ich habe wirklick nur die Zeit gebraucht die ich zum runterladen von 4,5 GB normalerweise brauche habe aber am Ende 5,12 GB Dateien.
Das ist so seltsam für mich. Ich kann ja auch nicht in einem Heft mit 32 Seiten 45 Seiten beschriften.
Wie geht das?
4 Antworten
Die meisten strukturierten Formate haben nicht minimale Größe als Ziel, sondern optimale Verwendbarkeit, bzw. soll der Umgang mit ihnen möglichst einfach sein.
Als Folge gibt es Redundanz und Kompressionsalgorithmen versuchen diese zu minimieren. Resultat: Weniger Größe, wenn es hinhaut.
In Deinem Heft lässt Du auch Absätze und strukturierst den Text, mit Satzzeichen etc. . Das erleichtert das Lesen, es ist aber nicht die kompakteste Darstellung.
Ja, zumindest, wenn man Wörterbuchverfahren als Basis nimmt. Wir wollten hier aber doch nicht über Kompressionsalgos dozieren, sonst werfe ich aus Spaß mal einen Huffman in die Runde, der ist nämlich viel lustiger :-D.
RLEs mag ich nicht, die stinken und versagen meist :-O .
Und man könnte natürlich im Wörterbuch noch Teilworte/Silben ersetzen durch weitere Einträge im Wörterbuch - *pfeif*
So geht das:
https://de.wikipedia.org/wiki/Datenkompression
Stark vereinfacht: sich wiederholender Code wird verkürzt. aus AAAAAA wird z.B. 6A, aus F0F0F0 wird 3F0.
Das Prinzip der Datenkompression sollte einem User schon geläufig sein wenn er mit besagten komprimierten Dateien umgeht.
ZIP ist ein solches Kompressionsformat, sprich es presst die entsprechenden Daten zusammen.
Ähm, das ist genau der Grund, wieso Zip-Dateien genutzt werden.
Man könnte das mit dem Heft noch etwas erweitern:
Die erste Seite wird als Lookup-Tabelle angelegt und enthält nichts anderes als z.B.
usw...
Dann werden im restlichen Heft nicht die jeweiligen Worte verwendet sondern z.B. **1** anstelle von Donaudampfschifffahrtselektrizitätenhauptbetriebswerkbauunterbeamtengesellschaft usw...
Das spart so einiges an Speicherplatz.