»As a cryptography and computer security expert, I have never understood
the current fuss about the open source software movement.
In the cryptography world, we consider open source necessary for good security; we
have for decades.
Public security is always more secure than proprietary security. (...)
For us, open source isn't just a business model;
it's smart engineering practice.«
– Bruce Schneier
28 Dateisysteme
Eine zentrale Komponente eines Betriebssystems ist die Implementierung eines Dateisystems. Linux unterstützt gleich eine ganze Reihe davon, so dass jeder Administrator das von der Funktionalität und Performance her für seine Zwecke beste Dateisystem wählen kann. Zudem werden wir auf die BSD-Dateisysteme eingehen.
28.1 Aufbau von Speichermedien
Vor den eigentlichen Dateisystemen stehen die Speichermedien. Exemplarisch wollen wir im Folgenden die Festplatten behandeln, andere Speichermedien wie CD-ROMs verhalten sich aber ähnlich wie diese.
28.1.1 Physische Struktur
Magnetische Speicherung
Bits und Bytes müssen grundsätzlich physisch gespeichert werden. Bei Festplatten geschieht das immer noch magnetisch. Eine Platte besteht vereinfacht gesehen aus folgenden Komponenten:
- einer oder mehreren drehbaren Magnetscheiben (inklusive Antrieb etc.)
- beweglichen Lese-/Schreibköpfen (inklusive Lager, Antrieb etc.)
- einem Hochleistungs-DSP für die Schreib-/Leseköpfe
- der Schnittstelle zur Verbindung mit dem Computer
- dem Festplatten-Cache
Die magnetisierbaren Scheiben sind übereinander angeordnet und besitzen jeweils einen oder zwei Lese-/Schreibköpfe. Ob jede Magnetscheibe dabei doppelseitig genutzt wird, ist vom jeweiligen Modell abhängig. Sollen nun Daten gelesen beziehungsweise geschrieben werden, so müssen die Lese-/Schreibköpfe zuerst in die richtige Position fahren und die Scheiben zu rotieren beginnen. Diese mechanischen Vorgänge haben im Allgemeinen eine Gesamt-Latenzzeit von 5 bis 10 Millisekunden, was im Vergleich zu den Zugriffszeiten auf den RAM wirklich extrem langsam ist. Sollen dann jedoch größere zusammenhängende Datenstrukturen gelesen werden, ist der Zugriff allerdings recht schnell.
Heutzutage wird jedoch diese interne Geometrie vor dem Betriebssystem versteckt. Wusste das Betriebssystem früher über die dreidimensionale CHS-Ansteuerung – Cylinder, Head und Sector – noch genau, wo sich ein Datenblock physisch auf der Platte befand, werden die Blöcke heute einfach nur gezählt. Ein Block – oder besser: Sektor – ist dabei immer 512 Byte groß.
So wird dem Fakt Rechnung getragen, dass eine Festplatte nur bei größeren Datenmengen ausreichend schnell ist. Und anstatt die Köpfe und Platten direkt anzusprechen, kann das Betriebssystem nun dank dem LBA-Modus (engl. logical block addressing – logische Blockadressierung) die Festplattenblöcke über eine einfache Nummer adressieren.
Automatische Komprimierung
Der Festplatten-Controller kann so auch selbst Optimierungen vornehmen, indem er beispielsweise Daten anders anordnet oder defekte Blöcke intern markiert und durch eine »Reserve« ersetzt. So bekommt das Betriebssystem von defekten Blöcken nichts mit und muss sich auch nicht um Optimierungen kümmern. Interessant ist ebenfalls, dass der Controller die Daten beim Schreiben auf die Platte zugleich komprimiert.
28.1.2 Logische Struktur
Die nächste Schicht bildet das jeweilige Dateisystem. Für dieses wird nur selten die gesamte Festplatte genutzt. In der Regel teilt man die Platte in mehrere Partitionen auf. Möchte man mehrere Betriebssysteme auf einem Rechner installieren, kommt man um diese Aufteilung nicht herum – schließlich sollen sich die beiden Systeme ja auch nicht in die Quere kommen. Im Vergleich zu unserem vorherigen Abschnitt sind wir im Dateisystemkontext eine Abstraktionsstufe höher und somit von der Adressierung der Daten über Blocknummern weiter entfernt:
Ein Dateisystem erlaubt den Zugriff auf gespeicherte Daten über Dateinamen, verwaltet bestehende Daten und entfernt diese bei Bedarf.
Blöcke im Dateisystem
In erster Linie verwaltet ein Dateisystem also die Zuordnung von Dateinamen zu Datenblöcken auf der Festplatte. Dabei werden teilweise mehrere Festplattenblöcke zu Dateisystemblöcken zusammengefasst: So kommt man schließlich zu Blockgrößen von 2048 oder 4096 Byte bei Dateisystemen. Schließlich müssen diese Blocknummern ja verwaltet werden, und kleinere Blöcke bedeuten mehr Nummern, was wiederum einen höheren Speicher- und Verwaltungsaufwand bedeutet. Außerdem kann auf zusammenhängende Daten schneller zugegriffen werden, als wenn diese wild auf der Platte verteilt sind: Große Blöcke bringen also vor allem auch einen Geschwindigkeitsvorteil.
Der Preis, mit dem man sich diese Geschwindigkeit erkauft, ist nun aber »Platzverlust« durch interne Fragmentierung. Schließlich kann das Dateisystem nur einzelne Blöcke adressieren. Ist eine einzelne Datei also kleiner als die Blockgröße, beziehungsweise wird bei größeren Dateien der letzte Block nicht ganz voll, so wird dieser Platz verschenkt. [Fn. Eine Ausnahme ist das Dateisystem ReiserFS 4: Hier werden halb leere Blöcke noch durch kleine Dateien aufgefüllt. Es können sich also zwei Dateien einen Datenblock »teilen«.] Das Dateisystem muss natürlich auch die folgenden Funktionen erfüllen:
Eigentümer & Co.
- Metadaten bereitstellen
Eine Datei umfasst nicht nur ihren Inhalt, sondern auch verschiedene Metadaten – in erster Linie natürlich ihren Namen, aber auch Benutzer, Gruppen und die dazugehörigen Rechte. Auch die Zeit der letzten Modifikation und alles, was man sonst so mit einer Datei verbindet, gehört hier dazu. Das Dateisystem muss diese Informationen speichern und mit der betreffenden Datei verknüpfen. - Hierarchie ermöglichen
Die meisten modernen Dateisysteme sind hierarchisch strukturiert, kennen also Verzeichnisse zum Ordnen von Dateien. - Freie Blöcke verwalten
Das Dateisystem muss natürlich auch den freien Speicherplatz verwalten. Am einfachsten passiert dies durch eine free-list, also eine Liste aller freien Blöcke.
28.1.3 Integration ins VFS
Nun gibt es aber mehr als nur ein einziges Dateisystem. Schon allein die Auswahl für Festplatten scheint gigantisch: Jedes Betriebssystem hat seinen eigenen Favoriten, und der liegt in der Regel auch noch in mehreren Versionen vor. Aber auch besondere Speichermedien wie CD-ROMs bringen ihr eigenes Dateisystem mit – wie das bekannte ISO 9660 --, das den besonderen Eigenschaften dieser Medien Rechnung trägt.
Damit ein Betriebssystem nun auf die unterschiedlichen Dateisysteme zugreifen kann, gibt es das bereits aus Kapitel 5, »Der Kernel«, bekannte virtuelle Dateisystem VFS (Virtual File System). Das VFS bildet die Abstraktion und die einheitliche Schnittstelle, in die alle Dateisystemtreiber integriert werden können. Probleme bei ausgefallenen Features sind bei dieser Integration zwar die absolute Ausnahme, kommen aber vor, wie die Schwierigkeiten mit der Integration von ReiserFS 4 in den Linux-Kernel gezeigt haben.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.