1.3 Digitale Speicherung und Verarbeitung von Informationen
In diesem Abschnitt wird kurz erläutert, wie ein Computer Informationen speichert und verarbeitet. Es besteht hierbei ein grundsätzlicher Unterschied zwischen analogen und digitalen Daten: Analoge Informationen lassen sich in einer kontinuierlichen Wellenform wie in Abbildung 1.5 darstellen, die in immer kleinere Einheiten unterteilt werden können.
In der Natur liegen alle Informationen zunächst in analoger Form vor: Das Bild, das Sie sehen, oder der Ton, den Sie hören, besitzt prinzipiell keine kleinste Informationseinheit oder Auflösung. Mit dieser Art von Informationen kann ein Computer heutiger Bauart nichts anfangen. Die besonderen Eigenschaften der Elektronik haben dazu geführt, dass Computer digital entworfen wurden. »Digital« stammt vom englischen Wort digit (»Ziffer«); dieses Wort ist wiederum vom lateinischen digitus (»Finger«) abgeleitet, da die Finger von jeher zum Zählen eingesetzt wurden.
Digital sind Informationen also immer dann, wenn sie in Form von Zahlen dargestellt werden können. Genauer gesagt werden die Daten binär gespeichert, das heißt als Abfolge von Einsen und Nullen. Das ist nicht genau dasselbe wie dual. Das Dualsystem ist das mathematische Zweiersystem, während binär allgemein die Speicherung beliebiger Daten durch zwei verschiedene Zustände bezeichnet.
Abbildung 1.5 Schematische Darstellung von Analogdaten als Welle
Die Speicherung von Zahlen erfolgt übrigens in der Tat dual, solange es sich um ganze Zahlen handelt. Eine Besonderheit gilt dabei für vorzeichenbehaftete (positive oder negative) Zahlen, bei denen das vorderste Bit für das Vorzeichen steht. Kompliziert wird es dagegen bei Fließkommazahlen, die in Exponentialschreibweise gespeichert werden. Auf die Darstellung von Zahlen im Computer wird in Kapitel 2, »Mathematische und technische Grundlagen«, näher eingegangen.
Abbildung 1.6 Schematische Darstellung binärer Digitaldaten
Charakteristisch für digitale Daten ist, dass es eine kleinste Informationseinheit gibt und dass die Information nicht mehr weiter aufgelöst werden kann. Während Analogdaten also durch die Wellenform gekennzeichnet sind, lassen sich Digitaldaten durch eine rechteckige Form darstellen (siehe Abbildung 1.6). In der Mathematik werden Objekte mit einem solchen »Mindestabstand« als diskrete Mengen bezeichnet. Ein Alltagsbeispiel ist die Folge der ganzen Zahlen – im Unterschied zu den rationalen oder gar reellen Zahlen, bei denen zwischen zwei beliebigen Elementen immer noch unendlich viele Zwischenwerte liegen.
Die Umwandlung der analogen Eindrücke aus der Realität in computergeeignete digitale Daten wird als Digitalisierung bezeichnet. Je nach Datenart wird sie zum Beispiel von einem Scanner oder einer Digitalkamera bei Bildern oder von einer Soundkarte bei Tönen durchgeführt. Die folgenden Abschnitte sollen einen groben Eindruck davon vermitteln, wie verschiedene Arten von Daten grundsätzlich gespeichert werden.
1.3.1 Digitale Bilddaten
Wie Hardware zur Bilddigitalisierung funktioniert, also Scanner und Digitalkameras, wird kurz in Kapitel 3, »Hardware«, angeschnitten. Beachten Sie, dass es zwei grundlegende Arten von Computergrafik gibt: Die Pixelgrafik (auch Bitmap-Grafik genannt), von der hier die Rede ist, speichert ein Bild als rechteckiges Raster quadratischer Farbinformationen ab, den sogenannten Pixeln. Die Vektorgrafik speichert dagegen Umrisslinien und Kurven von Zeichnungen in Form mathematischer Formeln.
Die Qualität eines gespeicherten Pixelbildes lässt sich durch die folgenden Sachverhalte charakterisieren:
- Die Auflösung gibt die Größe der einzelnen Pixel an. Die Angabe besagt, wie viele Pixel pro Zentimeter oder Inch gespeichert werden. Beachten Sie, dass für den Druck erheblich höhere Auflösungen erforderlich sind (etwa 300 Pixel pro Inch) als für eine gleich große Bildschirmfläche (gerechnet wird hier – unabhängig von der tatsächlichen Monitorgröße – mit 72 Pixeln pro Inch).
- Die Farbtiefe gibt an, wie viele Bits zur Speicherung der Informationen eines einzelnen Pixels verwendet werden. Je nach Farbtiefe kann eine bestimmte Anzahl verschiedener Farben eingesetzt werden. Beispielsweise ermöglicht eine Farbtiefe von 8 Bit nur 256 verschiedene Farben, 16 Bit bieten 65.536 Farben und 24 Bit sogar mehr als 16,7 Millionen (genauer gesagt 16.777.216).
- In der Regel werden die einzelnen Farben nicht stur durchnummeriert, sondern aus einzelnen Grundfarben zusammengesetzt. Ohne hier näher darauf einzugehen, gibt es die additive Farbmischung der Lichtfarben Rot, Grün und Blau (RGB) sowie die subtraktive Mischung der Druckfarben Cyan, Magenta, Gelb und Schwarz (CMYK). Normalerweise wird für die Intensität jeder einzelnen Grundfarbe ein Farbkanal gespeichert. Die Farbtiefe wird dann pro Kanal angegeben, bei einem RGB-Bild mit 24 Bit Farbtiefe also beispielsweise 8 Bit (oder 256 Intensitätsstufen) pro Kanal.
1.3.2 Digitale Audiodaten
Töne werden mithilfe eines Verfahrens digitalisiert, das man Sampling nennt. Das Audiosignal wird in bestimmten Zeitabständen immer wieder abgetastet, genauer gesagt wird die Amplitude (das Volumen) zum jeweiligen Zeitpunkt gemessen. Die Frequenz (Tonhöhe) ergibt sich dabei aus der zeitlichen Verteilung der Amplituden. Jeder einzelne Abtastvorgang (Sample) wird als numerischer Wert abgespeichert.
In der Folge erweist sich die digitalisierte Tonabfolge als diskret in zweifacher Hinsicht: auf der X-Achse zeitdiskret durch das gleichbleibende Intervall zwischen den Messungen; auf der Y-Achse wertdiskret durch die Beschränkung auf einzelne herausgegriffene (Mittel-)Werte.
Genau wie bei Bildern gibt es auch hier verschiedene Merkmale, die die Datenmenge und die Qualität der gespeicherten Daten betreffen:
- Die Sampling-Rate gibt die Anzahl der Messvorgänge pro Sekunde an. Je höher die Frequenz dieser Messungen, desto höher ist die Tonqualität. Audio-CDs haben beispielsweise eine Sampling-Rate von 44,1 kHz (Kilohertz), es wird also 44.100 Mal pro Sekunde gemessen. Multimedia-Produktionen wie Computerspiele oder Infotainment-Titel verwenden dagegen häufig die halbe Sampling-Rate von 22,05 kHz.
- Die Sampling-Tiefe gibt die Datenbreite des einzelnen gespeicherten Tons an, legt also fest, wie viele verschiedene Amplituden unterschieden werden. Bei Audio-CDs sorgt eine Sampling-Tiefe von 16 Bit (65.536 unterschiedliche Werte) für guten Ton; niedrigere Sampling-Tiefen klingen nicht besonders gut.
- Die Anzahl der Tonkanäle besagt, ob irgendeine Art von Raumklang gespeichert wird oder nicht. Wenn Audiodaten mono gespeichert werden, gibt es nur einen einzigen Kanal. Stereo verwendet zwei getrennte Kanäle, die über einen linken und einen rechten Lautsprecher ausgegeben werden können. Eine noch höhere Anzahl von Kanälen wie bei Quadrofonie, Dolby Surround oder 5.1-Sound bewirkt ein noch realistischeres Hörerlebnis.
Tabelle 1.2 stellt die verschiedenen Merkmale von Bilddaten den vergleichbaren Eigenschaften von Tondaten gegenüber, um die entsprechenden Beziehungen zwischen verschiedenen Arten von Digitaldaten zu verdeutlichen.
Informationsart | Bilddaten | Audiodaten |
Auflösung |
Bildauflösung, in Pixeln pro Zentimeter oder Inch |
Sampling-Rate, in Samples |
Datenbreite |
Farbtiefe |
Sampling-Tiefe |
Anzahl Kanäle |
Farbkanäle |
Tonkanäle |
1.3.3 Digitale Speicherung von Text
Reiner Text (nicht der formatierte Text in Textverarbeitungsprogrammen!) wird als Abfolge nummerierter Zeichen eines Zeichensatzes gespeichert. Je nach Datenbreite des verwendeten Zeichensatzes können unterschiedlich viele verschiedene Zeichen verwendet werden. Der grundlegende Computerzeichensatz ist noch heute ASCII. Es handelt sich um einen 7 Bit breiten Zeichensatz; er enthält also 128 Zeichen. Es sind sämtliche Zeichen für die Darstellung englischsprachiger Texte verfügbar.
Um auch Texte mit den Sonderzeichen der diversen europäischen Sprachen darstellen zu können, werden verschiedene Erweiterungen des ASCII-Codes verwendet. Da die 7 Bit der ASCII-Zeichen gewöhnlich in 8 Bit breiten Feldern gespeichert werden, steht Platz für weitere 128 Zeichen zur Verfügung. Auf diese Weise lassen sich lateinisch geschriebene Sprachen mit Sonderzeichen wie deutschen Umlauten darstellen, aber auch andere Buchstabenalphabete wie Arabisch, Russisch oder Griechisch. Silbenschriften wie Chinesisch oder Japanisch lassen sich dagegen auf diese Weise nicht speichern.
Um viele verschiedene Zeichensätze »unter einen Hut zu bringen«, wurde der Unicode-Standard eingeführt. Es handelt sich um einen Zeichensatz mit 16 bis 32 Bit breiten Zeichen; es können also mindestens 65.536 verschiedene Zeichen, in neueren Versionen sogar noch mehr, gespeichert werden. Auf diese Weise bietet Unicode genügend Platz für die Schriftzeichen der meisten Sprachen der Welt sowie für mathematische, technische und andere Sonderzeichen.
Die verschiedenen Zeichensätze werden in Kapitel 16, »Weitere Datei- und Datenformate«, genauer besprochen.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.