16.4 Intel VT-x und AMD-V
AMD und Intel versprechen umfangreiche Virtualisierungsunterstützung durch ihre Prozessoren. In Wirklichkeit steht die Technik erst am Anfang. Ich möchte Ihnen an dieser Stelle einen Überblick über die verschiedenen Techniken geben und deren Grenzen aufzeigen.
Kompromisse
Virtualisierung bedeutet immer auch Kompromisse. Bei einer Vollvirtualisierung muss man erhebliche Performance-Nachteile in Kauf nehmen. Für eine Paravirtualisierung, die diese Nachteile an vielen Stellen ausgleicht, ist es erforderlich, das Gastbetriebssystem zu erheblichen Teilen abzuändern, und die ressourcensparende Containervirtualisierung kann überhaupt nur identische Betriebssysteme in mehreren virtuellen Instanzen ausführen.
Das Ziel einer Prozessorunterstützung für Virtualisierung muss es sein, den Komfort einer Vollvirtualisierung für den Anwender zu erreichen und gleichzeitig deren Performance-Nachteile zu eliminieren. Bei Vollvirtualisierung laufen auch die Kernel-Mode-Teile der Gastbetriebssysteme nicht in Ring 0 des Prozessors, sondern je nach Virtualisierungslösung in Ring 1 oder 3. In diesen Ringen sind nicht alle Befehle möglich.
16.4.1 Gründe für Performance-Probleme
Die Virtualisierungssoftware fängt nun Befehle, die in Ring 0 nicht möglich sind, in Form einer Exception ab, so dass sie für das Gastbetriebssystem als privilegierte Befehle erscheinen. Im Falle der Speicherverwaltung bedeutet dies, dass die Virtualisierungssoftware aus der physischen Speichertabelle Speicher allokiert und in den Adressraum der Gastumgebung legt.
Bei der Intel-Architektur wird Speicher in einer Tabelle in Blöcken zu 4 KB verwaltet. Die Gastumgebung hat eine gleich strukturierte Tabelle, jedoch wird der Zugriff darauf abgefangen und die Tabelle in Wahrheit von der Virtualisierungssoftware mitverwaltet.
Hier liegt ein großes Performance-Hindernis für vollvirtualisierte Umgebungen. Der eigentliche Hauptspeicher eines Computers ist relativ langsam. Eine Beschleunigung ergibt sich durch den Cache. Der Cache-Speicher hängt jedoch immer komplett zusammen und wird aus Performance-Gründen nicht in Blöcken verwaltet. Bei jedem Abfangen der Speicherverwaltung muss daher der Cache komplett in den Hauptspeicher geschrieben werden, was zusätzlich zu der emulierten Speicherverwaltung viel Zeit kostet.
Ähnlich sieht es beim I/O-Zugriff aus. Hier liest und schreibt das Gastbetriebssystem in die I/O-Ports, was allerdings von der Virtualisierungssoftware abgefangen und in entsprechende Aktionen transformiert wird. Während einfache Bausteine, etwa ein serielles oder ein paralleles Interface, mit wenigen I/O-Ports auskommen, müssen Devices, bei denen es auf Geschwindigkeit ankommt, in den Speicheradressraum des Prozessors gelegt werden.
Ein Standard-Ethernet-Paket beispielsweise kann bis zu 1.500 Bytes groß sein. Neuere Ethernet-Karten unterstützen auch Jumbo-Pakete mit bis zu 9.000 Bytes. Da immer ein ganzes Paket übertragen werden muss, benötigt eine Ethernet-Karte immer mindestens den Speicheradressraum für ein Paket. Moderne Ethernet-Karten bieten jedoch Speicheradressraum für mehrere Pakete. Der Prozessor legt dabei mindestens ein Paket in den gemeinsamen Adressraum. Danach erfolgt die Übertragung über den DMA-Baustein des Motherboards, damit der Prozessor weiterarbeiten kann und die Übertragung über I/O-Ports nicht selbst übernehmen muss.
Hier liegt das größte Performance-Problem der Vollvirtualisierung: Echte DMA-Bausteine können nur im Kernel-Mode verwaltet werden. Daher muss bei jeder Verwendung eines Peripheriegeräts – etwa Netzwerk, Festplatte oder Bildschirm – ein Taskswitch in die Virtualisierungssoftware durchgeführt werden, der dazu führt, dass der Cache invalidiert wird und der langsame Hauptspeicher bemüht werden muss.
Validierung: Der Begriff Validierung (Test auf Plausibilität) bezeichnet die Kontrolle eines konkreten Wertes darauf, ob er zu einem bestimmten Datentyp gehört oder in einem vorgegebenen Wertebereich oder einer vorgegebenen Wertemenge liegt.
Um diese Performance-Nachteile einer virtualisierten Umgebung auszugleichen, gibt es verschiedene Ansätze. Ein softwareseitiger Ansatz ist der Austausch von Treibern nach der Installation des Gastbetriebssystems. Diese neuen Treiber versuchen nicht mehr, die Hardware zu programmieren, sondern übergeben solche Pakete, die an Netzwerkkarte, Festplattencontroller oder Videokarte gesendet werden sollen, an die Virtualisierungssoftware. Allerdings verläuft auch diese Übergabe nicht ohne Performance-Verlust. Da das Gastbetriebssystem grundsätzlich davon ausgeht, den gesamten Adressraum eines Computers allein nutzen zu können, müssen die Treiber absichtlich einen privilegierten Befehl ausführen, um eine Exception zu provozieren.
Dies hat natürlich wieder eine Invalidierung des Cache zur Folge. Erst dann kann die Virtualisierungssoftware die Pakete abholen. Lediglich die Emulation der Devices und der DMA-Bausteine fällt in diesem Fall weg.
16.4.2 Pacifica und Vanderpool sind inkompatibel
Um Abhilfe zu schaffen, bieten die Prozessorhersteller mittlerweile hardwareseitig Unterstützung an. AMD und Intel gehen hier unterschiedliche Wege – damit sind ihre Lösungen inkompatibel. Virtualisierungssoftware muss sowohl für AMD-V (Codename: Pacifica) und Intels VT-x (Codename: Vanderpool) Unterstützung bieten.
Abbildung 16.5 Unterschiedliche Implementierung bei den CPUs
Ring minus eins
Dabei lässt sich die hardwareseitige Unterstützung in drei Bereiche unterteilen: Als Erstes sind neue privilegierte Prozessorbefehle zu nennen. Grundsätzlich wird dabei eine neue, superprivilegierte Umgebung implementiert, die Intel »Ring minus eins« nennt.
So können mehrere Gastbetriebssysteme jeweils einen eigenen Ring 0 mit den dazugehörigen privilegierten Befehlen nutzen, ohne dass eine gegenseitige Beeinflussung möglich ist. Damit laufen die Kernel-Mode-Teile eines Betriebssystems nicht mehr in Ring 1 oder 3, wo jeder privilegierte Befehl per Exception abgefangen werden muss. Die Anzahl der Taskswitches wird dadurch deutlich reduziert, was generell eine höhere Performance bedeutet.
Ein moderner Prozessor ist Voraussetzung
Diese Technologie steht bei den modernen Prozessoren von AMD und Intel zur Verfügung. Alle namhaften Anbieter von Virtualisierungslösungen unterstützen heute beide Architekturen. Neben vollvirtualisierten Systemen können auch paravirtualisierte Systeme von der Prozessorunterstützung, insbesondere der Speicherverwaltungsunterstützung, Gebrauch machen. Durch die Einblendung von Schnittstellen der Virtualisierungslösung in den Adressraum der Gastbetriebssysteme können APIs realisiert werden, die zum Beispiel Ressourcen wie Hauptspeicher und Plattenplatz dynamisch zwischen den einzelnen Gastmaschinen verteilen. Dies würde eine Containervirtualisierung, die pro Computer nur ein Betriebssystem unterstützt, weitgehend überflüssig machen. Nötig dafür sind allerdings Schnittstellenabsprachen zwischen den Herstellern von Betriebssystemen und Virtualisierungslösungen.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.