[sage-ka] Virtualisierung als Sparmaßnahme

Anders Henke anders.henke at 1und1.de
Do Apr 9 09:57:47 CEST 2009


Am 28.03.2009 schrieb Olaf Hopp:
> Setup an der Fak.f. Informatik, Uni KA:
> Zwei _richtig_ gute Server, von denen einer auch alles alleine stemmen 
> koennte, Daten im SAN (iSCSI EqualLogic), repliziert auf eine zweite
> SAN-Kiste an einem zweiten Standort. Der andere ESX ist auch remote.
> 
> VMware ESX und mit Vmotion, DRS (automatische Lastverteilung) und
> HA (raucht der eine ESX ab, startet der andere die VMs einfach neu.

http://www.vmware.com/products/fault-tolerance/ wurde gerade
vorgestellt und kann das "HA" noch etwas steigern.
Die Gastsysteme/Instanzen werden dabei ueber die Hostsysteme
hinweg gespiegelt, d.h. beim Ausfall eines Hostsystems wird
die gleiche Instanz einfach auf einem anderen Hostsystem 
uebernommen und ohne Reboot weiterbetrieben.

Interessant ist das natuerlich nicht als Allheilmittel gegen
jegliche Idee von Nicht-Verfuegbarkeit; insbesondere Softwarefehler
und Fehlkonfigurationen schlagen da genauso oder haerter durch als
bei zwei seperaten Nodes im Clusterbetrieb, aber die Dinge, die man
klassisch auf dedizierte Hardware umlegt, um gegen Hardwareausfaelle
gefeit zu sein, lassen sich damit dann durchaus vereinfachen.

"Nebenbei" hat man noch den Bonus, dass man damit Systeme 
hochverfuegbar bekommen kann, die nicht fuer Hochverfuegbarkeit
oder Clusterbetrieb konzipiert wurden oder die zwar in einem
Cluster laufen, aber bei einem Neustart durch Hardwareausfall deutliche
Performanceeinbrueche zeigen. 
Ein Beispiel fuer ersteres waere die hochspezielle Windowssoftware, 
die zwar noch supportet, aber nicht mehr weiterentwickelt wird.
Ein Beispiel fuer zweiteres waere der geclusterte Datenbankserver, 
der nach einem Neustart aber mit leeren Caches hochkaeme und sich dann 
stundenlang traege wie ein Sack Kartoffeln benimmt.

> Zur Steuerung und (_sehr_ bequemen) Verwaltung des Ganzen brauchts noch 
> das VirtualCenter von VMware (das laeuft auch dann in einer VM - ja das 
> macht "man" so) - kostet auch noch mal extra.
[...]
> ESX und Virtual Center hat nicht viel mit dem 
> Umsonst-VMware-Server gemeinsam, bis man das am laufen hat, braucht es
> eine Weile.

Zum "Anschauen" kann man das kostenlose ESXi nehmen, das kommt einem
ungeclusterten ESX schon recht nahe.
Das installiert sich in ein paar Minuten von CD auf nackter Hardware,
anschliessend braucht man de facto ein Windows fuer die
Managementsoftware. Theoretisch geht auch alles ueber ein spezielles
CLI, das man sich einzeln besorgen kann, es ist aber deutlich
aufwaendiger als eine grafische Oberflaeche. Und unter Wine habe ich
bislang den vmware client nicht zum Laufen bekommen, daher gibt's
eben - wie du beschrieben hast - eine weitere virtuelle Instanz, in
der nur der vmware Client laeuft.

Das Virtualcenter ist zum Testen bzw. Betrieb eines einzelnen ESXi-Hosts
eher wenig hilfreich, beim Betrieb von ESX-Farmen hingegen "versammelt"
man damit die Konfiguration und Betrieb der Instanzen
(Gastsysteme/virtuelle Server) aller ESX-Server in eine gemeinsame
Oberflaeche.

> Kosten(ersparnis) ? Keine Ahnung, ob sichs unterm Strich rechnet - wir 
> haben keine Management mit spitzem Bleistift im Ruecken.
> Bereut haben wir es keine einzige Minute - man schläft leichter...

Die Berechnungen der vmware-Consultants sind teilweise sehr
an den Haaren herbeigezogen. Gerade fuer den Betrieb mit vmotion
(Umziehen von Instanzen zwischen Farmrechnern) kommt man letztlich
um ein SAN oder NAS nicht herum, und die in passender Qualitaet
sind nicht ganz billig (wie du auch schon erwaehnt hast). 
Je nach Menge der Server kann sich so eine Virtualisierung allein 
aus einem unmodifizierten Tagesgeschaeft aber schon nach 1-2 jahren 
durchaus lohnen.

Die diversen "Nebenbei"-Features ermoeglichen es einem, eine Reihe von 
neuen Funktionen zu bauen oder Methoden im Betrieb einzusetzen, die man
mit physikalischen Servern so nicht machen wuerde.

Vor dem grossen Dist-Upgrade Etch->Lenny auf dem "wichtigen" Server kann 
man sich z.B. mit den Virtualisierungssystemen in wenigen Sekunden eine 
Testkiste bauen, die ein Klon des Livesystems ist, zum anderen aber auch 
dann vor dem "richtigen" Update das Livesystem komplett als Snapshot 
"einfrieren" und zur Seite ablegen, um bei einem dennoch auftretenden 
Fehler sofort wieder zurueckschalten zu koennen. Man kann dabei nicht
nur den Platteninhalt, sondern auch CPU- und RAM-Ressourcen mit in den
Snapshot aufnehmen, um ggf. an identischer Stelle weiterzumachen.

Mit solchen Funktionen kann man dann wiederum auch Szenarien durchnehmen,
die den Betrieb insgesamt stabilisieren:
-Livesystem klonen
-Klon updaten, testen, fixen. Mist, funktioniert nicht.
-Klon wegwerfen, Livesystem erneut klonen
-Neuen Klon updaten, ohne die Fehler vom ersten Versuch zu machen.
-Livesystem wird anschliessend durch den erfolgreich upgedateten Klon 
 ersetzt, Klon damit zum neuen Livesystem. Das alte Livesystem kann
 man "nebenan" herumliegen lassen.

Bei einem physikalischen System bedeutet "Livesystem klonen" schnell
1-2 Stunden manueller Aufwand mit teilweise vielen Routinearbeiten,
fuer obigen Arbeitsmechanismus braucht man dann schnell einen ganzen Tag.
Bei virtualisierten Servern hingegen bricht sich der gesamte Ablauf
schnell auf ein-zwei Stunden herunter.


Anders
-- 
1&1 Internet AG              Knoepfchendruecker und Systemarchitekt
Brauerstrasse 48             v://49.721.91374.0
D-76135 Karlsruhe            f://49.721.91374.225

Amtsgericht Montabaur HRB 6484
Vorstand: Henning Ahlert, Ralph Dommermuth, Matthias Ehrlich, 
Thomas Gottschlich, Robert Hoffmann, Markus Huhn, Hans-Henning Kettler,
Dr. Oliver Mauss, Jan Oetjen

Aufsichtsratsvorsitzender: Michael Scheeren