TU Chemmnitz

Universitätsrechenzentrum

TU Chemnitz > URZ > Zeitung > Ausgabe 2/2003


CABS - Chemnitzer AFS Backup Suite


Ausgangssituation und Ziel

Die im Rahmen des HBFG-Projektes zum Ausbau der Kommunikations- und Applikationsserver-Infrastruktur des Campusnetzes seit Ende letzten Jahres schrittweise in Betrieb gesetzte Technik schaffte die Voraussetzungen für die Ablösung des seit 1997 im Einsatz befindlichen Verfahrens zur Datensicherung im AFS. Die Notwendigkeit zu diesem Schritt wurde bereits in
http://archiv.tu-chemnitz.de/pub/2001/0101/data/kasi.html dargestellt.
Im Folgenden werden das neue Verfahren - CABS - und die eingesetzten Techniken beschrieben.

Merkmale und Prinzipien

Bei der Entwicklung von CABS wurde auf folgende Merkmale und Prinzipien besonderer Wert gelegt:

Dazu wurde die Datensicherung in zwei Phasen untergliedert. In der ersten Phase werden aus den aktuellen Daten eines Volumes (RW-Volume) sogenannte Snapshots (RO-Volume bzw. BK-Volume) erzeugt, die den Zustand eines Volumes zu einem bestimmten Zeitpunkt "einfrieren" und dabei die Daten des Volumes auf einen zweiten Server übernehmen. Da AFS nur eine begrenzte Anzahl solcher Snapshots verwalten kann, wird in einer zweiten Phase von jedem Snapshot ein Dump angefertigt, aus dem sich im Bedarfsfall der Zustand des Volumes rekonstruieren lässt. Die in der ersten Phase angefertigen Snapshots sind direkt über Pfadnamen im AFS-Verzeichnisbaum benutzbar und ermöglichen es den Nutzern, direkt auf ältere Zustände ihrer Daten zuzugreifen (siehe unten). Die Dumps aus der zweiten Phase sind für Nutzer nicht direkt zugreifbar, können aber bei Bedarf zugänglich gemacht werden.

Datensicherung

CABS benutzt folgende Komponenten zum Speichern der Daten:

Das Bild 1 illustriert die Zusammenhänge und zeigt die Komponenten und eingesetzten AFS-Techniken:

Bild 1: Prinzip der Datensicherung mit CABS

Bild 1: Prinzip der Datensicherung mit CABS

Die Durchführung der Datensicherung geschieht dabei nach diesen Regeln:

Damit ist gewährleistet, dass das RO-Volume immer den Zustand eines Volumes vom Vortag repräsentiert, während das BK-Volume den Zustand vom letzten Wochenende enthält.

Restore

Der Rückgriff auf Datensicherungen ist typischerweise in diesen Situationen erforderlich und geschieht dann auf folgende Art und Weise:

  1. Betriebsbezogene Ausfälle (Hardware: Fileserver, RAID-Systeme,... ; Software: Betriebssystem, Filesystem, ...)
  2. Nutzungsbezogene Ausfälle (unbeabsichtigtes Löschen, Fehlfunktionen von Anwendungssoftware, Security, ...)

Die Technologie ermöglicht für den Fall, dass große Datenmengen aus der Datensicherung zurückgestellt werden müssen (z.B. bei Hardware-Problemen im RAID-System eines Fileservers) eine relativ schnelle Wiederverfügbarkeit, da alle Daten eines Fileservers in der Version vom Vortag als RO-Volumes am Backupserver bereits verfügbar sind. Das Rückstellen dieser Daten besteht dann lediglich im Umwandeln der Meta-Informationen zur Lokalisierung (die RO-Volumes werden in RW-Volumes konvertiert). Die Konvertierungsfunktionen laufen naturgemäß wesentlich schneller ab, als das Rückstellen der Daten von einem Medium. Gleichzeitig ermöglicht das Vorhandensein der RO-Volumes den direkten Zugriff auf den Stand vom Vortag.

Das Bild 2 zeigt die Nutzersicht auf die verschiedenen Versionen.

Bild 2: Beispiel: Nutzersicht auf HOME-Verzeichnisse

Bild 2: Beispiel: Nutzersicht auf HOME-Verzeichnisse

Jeder Nutzer wird also in seinem HOME-Verzeichnis unter dem Namen BACKUP/YESTERDAY den Stand seiner Daten vom Vortag und unter dem Namen BACKUP/LAST_WEEK den Stand vom letzten Wochenende direkt zugreifbar finden.

Stand

CABS befindet sich seit Anfang April parallel zum bisher genutzten Verfahren im Testbetrieb und soll Ende Mai dieses Verfahren vollständig ablösen. Da im alten Verfahren ebenfalls das BK-Volume - jedoch mit anderen Bedeutung - genutzt wird, kann die oben beschriebene Möglichkeit des Rückgriffs auf alte Versionen erst zum Ende der Testbetriebs realisiert werden.
Weitere Hinweise zum Umgang mit CABS (insbesondere zum Zugriff auf andere Versionen der Daten eines Volumes) werden bei Aufnahme des Produktionsbetriebs über die Web-Seite des URZ unter der Kategorie "Speicherdienste" veröffentlicht.

Thomas Müller, April 2003