[sage] Warum ich keine Bandlaufwerke mag

Benedikt Stockebrand me at benedikt-stockebrand.de
Sun Sep 26 13:38:41 CEST 2010


Moin Andreas und Liste,

Andreas Jellinghaus <aj at dungeon.inka.de> writes:

> Dazu meine Frage: wer hat eine Software, die zuverlässig meldet,
> das eine Platte im RAID kaputt ist?

in meinem Fall ZFS ((Open)Solaris, FreeBSD) in Kombination mit Nagios.
Ergänzend dazu noch der Fault Manager unter Solaris und smartd unter
FreeBSD.

> Und wer hat eine Idiotensichere Beschriftung an den Plattengehäusen,
> die mit der obigen Software / Lämpchen / Bios harmoniert, so das
> es "Unmöglich!"(TM) ist die falsche Platte versehentlich zu ersetzen?

Ich hab's zwar nur in dritter Reihe ausbaden dürfen (mein
Zimmernachbar war derjenige, der ein kaputtes RAID5 reparieren durfte,
aus dem ein Kollege versehentlich nicht die kaputte sondern eine heile
Platte rausgezogen hat), aber das ist der Grund, warum ich Hotspares
nicht als Luxus ansehe.  Platten werden erst gezogen, wenn das System
wieder redundant ist.

Das ist aber eine wesentliche Forderung an die RZ-Tauglichkeit von
Storage-Systemen.

> Mein Wunsch wären ja (n+2) Server - (n) für Betrieb, (1) für Test
> und (1) für Ersatz wenn ein Anderer ausfällt. Das Geld haben Firmen
> ja nur leider selten. (Oder die Server waren zu billig und es fallen
> bald viele aus ...)

Ich bin mir nicht sicher ob ich Dich hier richtig verstehe; wenn Du
das so machst, wie ich vermute, dann setzt Du dabei implizit voraus,
dass die Server im wesentlichen alle baugleich sind.  Das geht und ist
in vielen Fällen auch extrem sinnvoll.

Andererseits machen dann Serienfehler (vor langer Zeit mal die
kaputten Onboard-SCSI-Controller in den FSC N7040...) richtig viel
Ärger, außerdem ist die Hardware dann immer ein Kompromiss.  Und die
Diskussionen, weil ein "maßgeschneidertes" System für einen bestimmten
Aufgabenzweck billiger ist, können auch Nerven kosten.

>> 4) GAU -- alle Rechner über Nacht abgebrannt/blitzgegrillt:
>>    Mit einem Schlepptopp wie bei 3 verfahren.
>
> Hmm, manche RAM Anforderungen sind mit Laptop oder Desktop einfach
> nicht zu meistern. Aber schön wäre es.

Ich bin an der Stelle von einer eher kleinen Umgebung ausgegangen, da
sollte das als Provisorium einen Notbetrieb sicherstellen können.

Wenn's größer wird, sollte man nicht weiter als bis zur Variante 3
kommen.

> Mit fällt da immer ein: wer hat eigentlich die Daten über den Server,
> der nun defekt ist? Sprich CPU, RAM, Serie, sonstige Komponenten, 
> Partitionierung, RAID-Konfiguration, BIOS Einstellungen, ...?
> Man muss das ja nicht 1:1 übernehmen, aber es wäre vielleicht hilfreich,
> wenn man weis, was da geklaut wurde oder gebrannt hat, und was man nachkaufen
> müsste ...

Irgendwo muss doch noch die Rechnung von dem alten System mit einer
Liste der verbauten Komponenten sein, ich glaube, die liegt gerade
beim Finanzamt:-)

Mindestens von Legato gab es damals (ca. 2001) eine separate Software,
die sowas eingesammelt hat.  Ich habe an der Stelle allerdings (für
Solaris) einen Jumpstart-Server bevorzugt, auf dem die entsprechenden
Profile aller Maschinen lagen.  Damit brauchte ein Disaster Recovery
eine Neuinstallation (inclusive Backup-Client) und anschließend ein
reguläres Restore.

Aber Du hast Recht, das ist ein Thema, das gerne vergessen und von den
Herstellern von Backup-Software ziemlich konsequent als "out of scope"
deklariert.

Und es gibt noch ein anderes Problem: Wo bekomme ich baugleichen
Ersatz her?  Gerade mit Billig-RAID-Controllern habe ich schon böse
Geschichten mitbekommen, weil kein Ersatzcontroller mehr aufzutreiben
war, um die Daten von den durchaus noch funktionsfähigen Platten zu
bekommen.

> Zur sonstige Diskussion möchte ich noch beitragen:
> Wenn die Speicherkapazität da ist, dann ziehe ich differentielle Backups vor.
> Wochenbackup + 4 mal incrementell einspielen, das macht wenig Spaß.

Das hängt stark von den Randbedingungen ab; wenn ich eine Library und
leistungsfähige Software habe, macht das nur wenig Unterschied.

Aber in kleinen Umgebungen hast Du an der Stelle Recht, sofern ein
"klassisches" Backup gemacht wird.  Die Alternative, erstmal die Daten
1:1 auf einen anderen Rechner zu synchronisieren und dann nur noch
Wechselmedien für ein Disaster Recovery zu schreiben, macht das
teilweise unnötig.

> Richtig toll fände ich, wenn das differentielle Backup alle Dateien seit
> dem *VOR*letzten Vollbackup sichern kann. Nur für den Fall, das auch das
> letzte Vollbackup defekt geht.

Hmm.  Ich vermute, dass Du dazu immer zwei differentielle Backups
machen musst, aber grundsätzlich ist die Idee nicht dumm.

> Und toll ist natürlich jede Backup Software, die eine Liste aller Dateien
> auf dem System erstellt und mit auf das differenzielle Backup legt - damit
> man alles weglöschen kann, was auf dem Vollbackup noch rumlag, aber bis
> zum incrementellen Backup gelöscht wurde.

Wenn die Backup-Software das nicht macht, ist sie meiner Meinung nach
wohl ziemlich kaputt.

> Was ist denn eure Meinung dazu:
> Reicht ein normales Bankschliessfach für die Off-Site Lagerung, oder
> braucht man je nach Backup-Medium was Besonderes?

Hängt ganz von Deinen Anforderungen ab.


Viele Grüße,

    Benedikt

-- 
			 Business Grade IPv6
		    Consulting, Training, Projects

Benedikt Stockebrand, Dipl.-Inform.   http://www.benedikt-stockebrand.de/




More information about the SAGE mailing list