16.2 Konzepte
Wie Sie wahrscheinlich schon bemerkt haben, gibt es unterschiedliche Konzepte und Möglichkeiten der Virtualisierung. Um den umfassenden und verallgemeinernden Begriff »Virtualisierung« näher definieren zu können, müssen wir uns kurz mit Begriffen wie »virtuelle Maschine«, »virtueller Server«, »virtuelle Laufzeitumgebung« und »Virtualisierungssoftware« beschäftigen.
16.2.1 Virtuelle Maschinen, Server und Laufzeitumgebungen
Um diese Begriffe fassen zu können, müssen wir gar nicht in die Weiten des Internets eintauchen. Auch Sie sind garantiert schon einmal einer virtuellen Maschine (VM) begegnet, spätestens wenn Sie Java auf Ihrem Computer installiert haben. Bei der Programmiersprache Java haben Sie es mit sogenannten Java Virtual Machines (JVM) zu tun, die Ihnen eine hypothetische Maschine zur Verfügung stellen. Hierbei handelt es sich um eine virtuelle Ausführungsumgebung mit einem virtuellen Prozessor und emulierten Schnittstellen. Hier liegt auch das Geheimnis, warum Applikationen, die in Java geschrieben sind, auf jedem beliebigen Betriebssystem ausführbar sind, auf dem die virtuelle Java-Laufzeitumgebung installiert ist. Die Applikationen werden in einer virtuellen Maschine vom darunterliegenden Betriebssystem separiert und agieren so unabhängig von diesem.
Virtuelle Server hingegen bilden ein vollständiges Computersystem nach und nicht nur eine Laufzeitumgebung für einzelne Applikationen. Virtuelle Server können somit ganze Betriebssysteme beherbergen. Der virtuelle Server ist für das darunterliegende Betriebssystem, den sogenannten Host, nur eine Anwendung und läuft damit unabhängig von der verwendeten Hardware.
Virtuelle Maschinen teilen einen Computer in mehrere parallele Einheiten auf. Hierbei stellt eine virtuelle Maschine entweder einen virtuellen Server oder eine virtuelle Laufzeitumgebung dar. Virtuelle Server sind vollständig nachgebildete Computersysteme, die ein Betriebssystem beherbergen können. Virtuelle Laufzeitumgebungen sind demgegenüber nur Umgebungen für einzelne Anwendungen. Wir wollen uns im Folgenden der Virtualisierung von ganzen Betriebssystemen (virtuelle Server) zuwenden und die virtuelle Laufzeitumgebung außer Acht lassen.
16.2.2 Paravirtualisierung
Die Technik der Paravirtualisierung können Sie sich vereinfacht als Kompromiss zwischen einer vollständigen Virtualisierung und derjenigen auf Betriebssystemebene vorstellen. Dies bedeutet explizit, dass mehrere voneinander getrennte virtuelle Maschinen mit eigenen Betriebssystemen auf eine gemeinsame Hardware zugreifen. Gesteuert und verwaltet wird dies durch einen Hypervisor. Das Wort Para stammt aus dem Griechischen und bedeutet u. a. »nebenher«.
Im Unterschied zur vollständigen Virtualisierung muss bei einer Paravirtualisierung das Gastsystem angepasst werden, da es nicht direkt mit der Hardware, sondern durch den Hypervisor mit ihr kommuniziert. Dies geschieht durch separat bereitgestellte Schnittstellen. In Abbildung 16.1 ist die grundsätzliche Wirkungsweise der Paravirtualisierung schematisch dargestellt.
Der Host besteht aus einem angepassten Kernel und einem privilegierten Betriebssystem zur Verwaltung der virtuellen Maschinen. Die Paravirtualisierung setzt hierbei unter dem eigentlichen Kernel an.
Eine zusätzliche Schicht, der sogenannte Hypervisor, sitzt zwischen der eigentlichen Hardware und dem Kernel des Hosts. Dieser wiederum stellt im Regelfall alle notwendigen Treiber für die virtuellen Maschinen zur Verfügung. Dies hat den entscheidenden Vorteil, dass eine Virtualisierung auf jeder Hardware möglich ist, auf der auch der Host läuft.
Abbildung 16.1 Paravirtualisierung
Vor- und Nachteile
Paravirtualisierung ist höchst effizient: Von allen Hypervisor-Ansätzen ist diese Technik die leistungsstärkste. Der bekannteste Vertreter der Paravirtualisierung ist Xen. Die virtuellen Maschinen kommunizieren quasi direkt mit der Hardware, und dadurch entsteht ein sehr geringer Overhead. Allerdings müssen die Gastsysteme angepasst werden. Dies erfordert Zugriff auf den Quelltext des Betriebssystems und erklärt die Fokussierung auf Open-Source-Systeme wie beispielsweise Linux. Dieser Nachteil wird durch die hardwarebasierte Virtualisierung wettgemacht. Auf diese Technik gehe ich im folgenden Abschnitt ein.
16.2.3 Hardwareunterstützte Virtualisierung
Virtualisierung kann nicht nur durch Emulation erreicht werden. Mit der geeigneten Hardware lässt sich noch viel mehr erzielen. Wie die gesamte Virtualisierung, so ist auch die hardwareunterstützte Virtualisierung eine sehr alte Technik. Die Geschichte reicht mehr als 40 Jahre zurück. Allerdings kam diese Technik nur auf großen Servern und Mainframes zum Einsatz, auf Desktop-PCs spielte sie nie eine große Rolle.
Einfluss auf Prozessoren
Dies hat sich in den letzten Jahren stark verändert, und so ist auch hier die Virtualisierung massiv auf dem Vormarsch. Die Nachfrage steigt, deshalb ist es nicht verwunderlich, dass die großen Prozessorhersteller, zum Beispiel Intel und AMD, ihr Stück vom Kuchen haben möchten. So gab es seit Ende 2005 zuerst von Intel und ein Jahr später von AMD eine neue Generation von Prozessoren, die einen Teil der Virtualisierungsfunktionalität auf CPU-Ebene abbilden.
Abbildung 16.2 Zwei verschiedene Arten der Virtualisierung: links durch eine Virtualisierungssoftware(zum Beispiel VMware), rechts durch Virtualisierung auf Hardwareebene (zum Beispiel Intel mit Vanderpool) (Bildquelle: Wikipedia).
Vorteile
Die Vorteile dieser Funktionsverlagerung in die Hardware sind vielfältig:
- Die virtuellen Maschinen haben eine wesentlich höhere Leistung mit geringerem Overhead.
- Aufgrund der Unterstützung durch den Prozessor ist die Architektur der Virtualisierungslösung schlanker. Die Unzulänglichkeiten der Prozessorarchitektur müssen nicht mehr berücksichtigt werden, und somit wird eine höhere Stabilität erreicht.
- Die Gastsysteme müssen nicht mehr angepasst werden. Somit können auch proprietäre Betriebssysteme wie Microsoft Windows in einer virtuellen Umgebung installiert werden.
- Die Separierung der virtuellen Maschinen untereinander ist konsequenter umgesetzt, da diese Trennung bereits im Prozessor umgesetzt wird.
- Die Erweiterung der Virtualisierungsbefehlssätze in die CPU ist bei Intel und AMD ähnlich. Dadurch existiert eine gewisse Standardisierung, die unter Umständen zu einer Interoperabilität der Virtualisierungslösungen führen wird. Die ersten Anzeichen für diese Austauschbarkeit und Vereinfachung sind zurzeit bei Parallels zu beobachten, die ihre Consumer- und Firmenlösungen zusammenlegen.
Nachteile
Nachteile lassen sich bei dieser Virtualisierungstechnik nicht entdecken, wenn man einmal davon absieht, dass die Anwender oder Administratoren teilweise neue Hardware brauchen, wenn sie auf diese Technik umsteigen wollen.
Welche Prozessoren bieten diese Technik?
Prozessoren, die sich für Hardwarevirtualisierung eignen, tragen folgende Bezeichnungen:
- Intel VT-x (Virtualization Technology)
Codename »Vanderpool«. Bei Intel ist die Erkennung, ob die Prozessoren Hardwarevirtualisierung unterstützen, viel einfacher. - AMD SVM (Secure Virtual Machine)
Codename »Pacifica«. Bei AMD sind prinzipiell Sempron-Prozessoren nicht hardwarevirtualisierungsfähig. Alle Opteron- und Athlon-Prozessoren, die auf dem AM2-Socket Platz finden, unterstützen heute AMD-V.
Die Vorteile einer hardwareunterstützten Virtualisierungslösung liegen auf der Hand:
- beliebige unmodifizierte Betriebssysteme als virtuelle Maschinen ausführbar
- wesentlich höhere Leistungsfähigkeit der virtuellen Maschinen
- höhere Stabilität durch geringere Notwendigkeit der Emulation
- mehr Sicherheit durch höhere Isolation zwischen Host und VM
- hardwarebedingte Standardisierung
Neben der höheren Geschwindigkeit bei den neuen Prozessoren, wovon natürlich jede Anwendung und auch Virtualisierung profitiert, kann Xen hier seine Stärken voll ausspielen.
Eignet sich mein Prozessor?
Um herauszufinden, ob der Prozessor in Ihrem PC die nötige PAE-Erweiterung (Physical Address Extension) besitzt, die Sie für die hardwarebeschleunigte Virtualisierung benötigen, führen Sie das Kommando grep pae /proc/cpuinfo in einem Terminal aus:
flags: fpu vme de pse tsc msr pae mce cx8 apic sep
mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr
sse sse2 ss ht tm pbe nx lm pni monitor ds_c pl vmx
est tm2 cx16 xtpr lahf_lm
Wenn Sie wie in der oben stehenden Ausgabe die Abkürzung pae finden, dann unterstützt Ihr Prozessor die hardwarebeschleunigte Virtualisierung.
Damit ein vollständig virtualisiertes Gastsystem betrieben werden kann, ist die Unterstützung von Gastprozessoren zwingend erforderlich. Wenn Sie nicht wissen, ob Ihr Prozessor dies beherrscht, hilft ebenfalls ein Blick in die oben ausgegebenen CPU-Flags. Suchen Sie bei Prozessoren von Intel nach der Abkürzung vmx, bei AMD-Prozessoren nach svm.
Wenn Sie diese Bezeichnung finden, wird die vollständige Virtualisierung von Ihrem Prozessor unterstützt. Allerdings ist die Option zur vollständigen Virtualisierung in vielen PCs standardmäßig abgeschaltet. Sie müssen sie erst im BIOS Ihres PCs einschalten.
Aktuelle Versionen von Windows können Sie nur als Gastsystem installieren, wenn Ihr Prozessor die vollständige Virtualisierung unterstützt. Der Grund besteht darin, dass ein Betriebssystem sonst angepasst werden muss, damit es als Gast auf einer virtualisierten Umgebung wie Xen läuft. Damit scheiden normalerweise Betriebssysteme wie Windows aus, da sie nicht in Form von veränderbarem Quelltext vorliegen.
Physische vs. virtuelle CPU
Um ein Betriebssystem zu virtualisieren, müssen einige Bedingungen zwingend erfüllt sein. Man begann relativ früh in der Geschichte der Computer mit der Virtualisierung von Prozessoren. Die Konzepte des Time-Sharing und Multi-Programming revolutionierten die Verwendung einer CPU und veränderten unsere Vorstellung von ihr. Erstmals trennte man die Funktion einer CPU von der zugrundeliegenden Hardware. Man unterschied ab dem Zeitpunkt zwischen physischer und virtueller CPU.
Zur Erinnerung: Ein physischer Prozessor kann nur eine Aufgabe (Operation) auf einmal ausführen. Dies kann sich auch mit größter Anstrengung nicht ändern, aber es gibt einen Trick: Man unterbricht regelmäßig die Arbeit des Prozessors, speichert den aktuellen Bearbeitungsstand und gibt dem Prozessor damit die Gelegenheit, eine andere Aufgabe auszuführen, bevor auch diese Arbeit wieder unterbrochen wird. Diese Unterbrechungen geschehen beispielsweise alle zehn Millisekunden und sind so kurz, dass der Anwender davon nichts bemerkt.
Der grundlegende Unterschied besteht darin, dass jede Anwendung jetzt »denkt«, sie hätte einen eigenen Prozessor, der die ihm gestellten Aufgaben exklusiv bearbeitet. Wenn mehrere Anwendungen ihre Aufgaben an die CPU geben, entstehen auf diese Art mehrere »virtuelle Prozessoren«.
Die physische CPU und die virtuelle CPU sind nicht identisch!
Wenn das Betriebssystem läuft, befindet sich die CPU im privilegierten Modus. Dieser Modus ermöglicht die eben beschriebene Virtualisierung der CPU und erlaubt beispielsweise den Anwendungen den Zugriff auf realen Speicher. Nach dieser Übersicht möchte ich jetzt detaillierter auf die eben angesprochene Architektur eingehen. Ich beginne mit einer präzisen Beschreibung der x86-Architektur.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.