| Das ZIP-Datenkompressionsverfahren |
|
|
Letztmalig dran rumgefummelt: 22.06.26 01:36:57 |
| Zip & Co - ZIP ist übrigens die Abkürzung für „Zigzag Inline Package", deutsch so etwas wie „zeilenweise im Zickzack gefaltetes (Daten-)Paket". Es wurde 1989 von Phil Katz geschrieben, der es als PKZIP (Phil Katz's Zip) vertrieb. Zip ist so bis heute der meistverbreitete Standard zur verlustfreien Datenkomprimierung. Andere bekannte Komprimierer sind ARJ (nach seinem Erfinder Archiver von Robert Jung" genannt) und RAR (auch nach dem Erfinder "Eugene Roshal Archiver" benannt). | |||||||||
|
1. Problembeschreibung 2. Informationsgehalt von Zeichen und Zeichengruppen 3. Häufigkeitsverteilung von Zeichen 4. Bits reduzieren - egal, WIE!!! 5. Präfixe, Fano-Bedingung - +++ START +++ Stop+++ 6. Weiterführende Literatur 7. Linkliste zum Thema 8. Verwandte Themen |
|||||||||
|
|||||||||
Quellen:
|
|||||||||
|
| 1. Problembeschreibung |
|
|
|
| Bei der Datenkomprimierung werden redundante oder unnötige Informationen in einer Datei reduziert. Dadurch benötigt die Datei weniger Speicherplatz auf der Festplatte und lässt sich im Internet oder über Netzwerke wesentlich schneller übertragen. e | |||||||||||||||||||
| AGATGCCGTTACGA wird nun zu: 0000100111000011010000111000110001100111101001010000001000110011100001 also 70 Bit | |||||||||||||||||||
|
GTCCAGAATTGATCCACGTTCCCAGTGATTCGTCGATTGCTTACCGTATGCCTGAGTCAGCAGTAGTTCATCCTAGGCCTACTAGCGATCAGGTACAT
(99 Eingabezeichen) wird nun zu: 001111010000011000110000100111000010000110100101000011100001101000001100011000010001100111101001010000011000110001100001001111010000111000011010010100 000110011110100000110011100001101001010000111000111010010100000010001100011001111010000001101000011100011000111010000111000010011110100000110000100111 000110000100111101000000100111101001010000011000011010000011000111010000001001110011100011000111010000001000111010000001001110001100111000011010000011 0000100111001111010000001000110000110100 also 490 Bit |
|||||||||||||||||||
|
|
Nachfafolgend tasten wir uns an Möglichkeiten aber auch auftretende Probleme heran, welche zum Ziel hben, den zu übertragenden Bitstrom wesentlich zu reduzieren ohne dabei Informationen zu verlieren. | ||||||||||||||||||
|
|||||||||||||||||||
| AGATGCCGTTACGA (14 Eingabezeichen) werden nun zu: 00 01 00 11 01 01 01 01 11 11 00 01 01 00 also 42 Bit | |||||||||||||||||||
| AGTCCAGAATTGATCCACGTTCCCAGTGATTCGTCGATTGCTTACCGTATGCCTGAGTCAGCAGTAGTTCATCCTAGGCCTACTAGCGATCAGGTACAT (99 Eingabezeichen) werden nun zu: 00 01 11 01 01 00 01 00 00 11 11 01 00 11 01 01 00 01 01 11 11 01 01 01 00 01 11 01 00 11 11 01 01 11 01 01 00 11 11 01 01 11 11 00 01 01 01 11 00 11 01 01 01 11 01 00 01 11 01 00 01 01 00 01 11 00 01 11 11 01 00 11 01 01 11 00 01 01 01 01 11 00 01 11 00 01 01 01 00 11 01 00 01 01 11 00 01 00 11 also 198 Bit |
| 2. Informationsgehalt von Zeichen und Zeichengruppen |
|
|
|
|
|
Unter Annahme der Tatsache, dass wir nicht die Kaprekartiefe, sondern die Regelmäßigkeit der Wiederkehr der einzelnen Werte selbiger suchen, fällt die Aufgabe heute typischerweise in den Bereich der nicht entscheidbaren Probleme. Und diese Beschreibung selbst zu finden, dürfte dann schon in die Klasse der komplexen Probleme fallen. | ||||||||
|
| 3. Häufigkeitsverteilung von Zeichen |
|
|
|
|
|
Das Grundprinzip besteht darin, systematisch mit den kleinstmöglichen Werten in den kleinstmöglichen Boxen die Gegenstände abzulegen und anschließend systematisch kleinere Gesamtwerte durch größere volumengleich zu ersetzen, Nachfolgend eine Idee, welche erst einmal nicht schlecht aussieht! | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| HANS ZOG EIN TUECHLEIN AUS DER TASCHE, WICKELTE DEN KLUMPEN HINEIN, SETZTE IHN AUF DIE SCHULTER UND MACHTE SICH AUF DEN WEG NACH HAUS. |
|
|
|
|
|
|
Das Grundprinzip besteht immer noch darin, systematisch die am häufigsten vorkommenden Zeichen durch mäglichst kleine Bitgruppen zu ersetzen, aber diese beim wieder einlesen 100 %ig genau zurück zu erhalten. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| HANS ZOG EIN TUECHLEIN AUS DER TASCHE, WICKELTE DEN KLUMPEN HINEIN, SETZTE IHN AUF DIE SCHULTER UND MACHTE SICH AUF DEN WEG NACH HAUS. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 5. Präfixe, Fano-Bedingung - +++ START +++ Stop+++ |
|
|
|
|
|
|
| 6. Weiterführende Literatur |
|
|
|
|
|
|||||||||||
|
| 7. Links zum Thema |
|
|
|
|
|
|
| http://www.mathematische-basteleien.de/kaprekarzahl.htm | |
| 8. Verwandte Themen |
|
|
|
|
|
Das Vorangestellte hilft wirtschaften, löst jedoch kein einziges Problem (allerdings ohne Beachtung der Worst-Case-Strategien wird man auch nicht erfolgreich Software entwickeln und/oder informatische Projekte realisieren können). Deshalb nunmehr das, was wirklich Arbeiten hilft. | |||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
zur Hauptseite |
© Samuel-von-Pufendorf-Gymnasium Flöha | © Frank Rost am 7. Juni 2026 um 16.44 Uhr |
|
... dieser Text wurde nach den Regeln irgendeiner Rechtschreibreform verfasst - ich hab' irgendwann einmal beschlossen, an diesem Zirkus nicht mehr teilzunehmen ;-) „Dieses Land braucht eine Steuerreform, dieses Land braucht eine Rentenreform - wir schreiben Schiffahrt mit drei „f“!“ Diddi Hallervorden, dt. Komiker und Kabarettist |
|
Diese Seite wurde ohne Zusatz irgendwelcher Konversationsstoffe erstellt ;-) |