16.3 Zusammenfassung
Die Darstellung von Textdaten im Computer befindet sich im Wandel: Vom einfachen ASCII-Zeichensatz, der nur die englische Sprache korrekt darstellen konnte, ging die Entwicklung über viele verschiedene, individuell entwickelte 8-Bit-ASCII-Erweiterungen, dann über deren Standardisierung als ANSI- und ISO-Zeichensätze bis hin zum Universalstandard Unicode. Es ist zu hoffen, dass möglichst bald alle Betriebssysteme, Programmierumgebungen und Anwendungen Unicode unterstützen werden.
Textbasierte Dateiformate garantieren die Lesbarkeit durch Menschen und den einfachen Datenaustausch, notfalls auch viele Jahre, nachdem das ursprüngliche Anwendungsprogramm, für das sie entwickelt wurden, nicht mehr existiert. Es gibt enorm viele unterschiedliche Textformate: Einige stellen einfach formatierten Text dar, andere beschäftigen sich mit der Codierung völlig anderer Daten. Bekannte Beispiele sind XML und HTML, LaTeX oder das Rich Text Format (RTF).
Auf eine optimierte Dateigröße und schnelle maschinelle Verarbeitung sind dagegen die binären Dateiformate spezialisiert. Sie enthalten sämtliche Formatierungen und Metainformationen nicht im Klartext, sondern in Form von Zahlencodes. Aus diesem Grund werden binäre Formate insbesondere für alle datenintensive Dateiarten wie Bilder, Grafiken, Audio und Video eingesetzt.
Abgerundet wurde dieses Kapitel durch einen kurzen Überblick über den Umgang mit Archivdateiformaten. Sie sind die wichtigsten Formate für Softwaredownloads aus dem Internet sowie zur Datensicherung. Während unter Windows grafische Tools von Microsoft oder von Drittanbietern dafür verwendet werden, sind Unix-Systeme in der Regel von Haus aus mit diversen Kommandozeilen-Archivtools ausgestattet.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.