-
Die
vorliegende Erfindung betrifft das Gebiet der redundante Arrays
kostengünstiger Festplatten (RAID) Speichersysteme und
besonders das Optimieren der Rekonstruktion eines zugehörigen
Laufwerks nach seiner Abtrennung.
-
Redundante
Arrays kostengünstiger Festplatten (RAID), sind zu wirksamen
Werkzeugen zum Beibehalten von Daten innerhalb derzeitiger Computersystemarchitekturen
geworden. Ein RAID-System benutzt ein Array von kleinen, kostengünstigen
Festplatten, die dazu geeignet sind, Daten unter den verschiedenen
Laufwerken zu reproduzieren oder zu verteilen. Eine detaillierte
Beschreibung der verschiedenen RAID Level ist in dem Artikel
von Patterson, et al. "A Case for Redundant Arrays of Inexpensive
Disks (RAID)", ACM SIGMOD Conference, Juni 1988,
erhältlich. Dieser Artikel ist hiermit durch Bezugnahme
in die vorliegende Anmeldung inkorporiert.
-
Es
existieren verschiedene Level von RAID Implementationen. Das einfachste
Array, RAID Level 1, umfasst eine oder mehrere Festplatten
zur Datenspeicherung und eine gleiche Anzahl von zusätzlichen ”Spiegel”-Festplatten
zum Speichern einer Kopie von all den Informationen, die in den
Datenfestplatten enthalten sind. Die übrigen RAID Level 2, 3, 4, 5 und 6 unterteilen
alle zusammenhängende Daten in Teilstücke zur
Speicherung über die verschiedenen Festplatten.
-
RAID
Level 2, 3, 4, 5 oder 6 Systeme
verteilen diese Daten über die verschiedenen Festplatten in
Blöcken. Ein Block besteht aus vielen aufeinander folgenden
Sektoren, wobei ein Sektor ein physikalischer Abschnitt eines Festplattenlaufwerks,
beinhaltend eine Ansammlung von Bytes, ist. Ein Sektor ist die kleinste
Einheit eines Festplattenlaufwerks zum Datentransfer. Sobald ein
Datenblock auf eine Festplatte geschrieben worden ist, wird diesem
eine Festplattenblocknummer (DBN) zugeteilt. Alle RAID Platten weisen
dasselbe DBN System auf, sodass ein Block auf der jeweiligen Platte
eine gegebene DBN aufweist. Eine Ansammlung von Blöcken
auf den verschiedenen Platten mit derselben DBN sind gemeinsam als
Streifen bekannt.
-
Darüber
hinaus verwenden viele der derzeitigen Betriebssysteme die Zuteilung
von Speicherraum auf Massenspeichergeräten durch Partitionieren
dieses Speicherraums in Volumes. Der Begriff ”Volume” bezieht
sich auf das logische Gruppieren von physischen Speicherraumelementen,
die über eine Vielzahl von Platten und zugehörigen
Plattenlaufwerken verteilt sind, wie zum Beispiel in einem RAID
System. Volumes sind Teil einer Abstraktion, die eine logische Betrachtungsweise
des Speicherraums im Gegensatz zu einer physikalischen Betrachtungsweise
des Speicherraums erlaubt. Die meisten Betriebssysteme sehen Volumes
so, als ob diese unabhängige Festplattenlaufwerke seien.
Volumes werden erzeugt und erhalten durch eine Volume Management
Software. Eine Volumegruppe ist eine Ansammlung von verschiedenen
Volumes, die eine gemeinsame Gruppe von Laufwerken umfassen.
-
Einer
der größten Vorteile eines RAID Systems ist seine
Fähigkeit, Daten von einer ausgefallenen Bestandteils-Platte
anhand der Information, die auf den verbleibenden in Betrieb befindlichen
Platten vorhanden ist, zu rekonstruieren. In den RAID Leveln 3, 4, 5, 6 wird
Redundanz durch den Gebrauch von Paritätsblöcken
(Parity Blocks) erreicht. Die Daten, die in einem Paritätsblock
eines vorgegebenen Streifens enthalten sind, sind das Ergebnis einer
Berechnung, die jedes Mal vorgenommen wird, sobald ein Schreiben
auf einem Datenblock in dem Streifen erfolgt. Die folgende Gleichung
wird gewöhnlicher Weise benutzt, um den nächsten
Zustand eines gegebenen Paritätsblocks zu berechnen:
Neuer
Paritätsblock = (alter Datenblock xor neuer Datenblock)
xor alter Paritätsblock
-
Der
Speicherort dieses Paritätsblocks variiert zwischen den
RAID Leveln. RAID Level 3 und RAID Level 4 benutzen
eine spezifische Platte, die einzig und allein zur Speicherung von
Paritätsblöcken dient. RAID Level 5 und
RAID Level 6 überlappen die Paritätsblöcke über
all die verschiedenen Platten. RAID Level 6 unterscheidet
sich dadurch, dass es zwei Paritätsblöcke pro
Streifen aufweist und damit der gleichzeitigen Abtrennung von zwei
Platten Rechnung trägt. Falls eine vorgegebene Platte in dem
Array abgetrennt wird, können die Datenblöcke und
der zugehörige Paritätsblock für einen
vorgegebenen Streifen von den verbleibenden Platten kombiniert werden,
um die fehlenden Daten zu rekonstruieren.
-
Ein
Verfahren, um mit der Abtrennung einer einzelnen Platte in einem
RAID System umzugehen, ist die Integration einer globalen Hot Spare
Platte (Global Hot Spare Disk). Eine globale Hot Spare Platte ist
eine Platte oder eine Gruppe von Platten, die zum Ersatz einer abgetrennten
primären Platte in einer RAID Konfiguration dienen. Das
Gerät ist eingeschaltet oder wird als ”hot” angesehen,
wobei das Gerät jedoch nicht aktiv in das System eingreift.
Sobald eine Platte in einem RAID System abgetrennt wird, übernimmt
die globale Hot Spare Platte die Aufgabe der abgetrennten Platte
und rekonstruiert all die Volume-Teile der fehlenden Platte unter
Zuhilfenahme der Datenblöcke und Paritätsblöcke
der verbleibenden in Betrieb befindlichen Platten. Sobald die Daten
rekonstruiert sind, fungiert die globale Hot Spare Platte als eine
Bestandteils-Platte des RAID Systems so lange, bis eine Wiederverbindung
der abgetrennten RAID-Platte erfolgt. Sobald die abgetrennte primäre
Platte wiederverbunden ist, kann eine Rückkopie der rekonstruierten
Daten von der globalen Hot Spare Platte auf die wiederverbundene primäre
Platte erfolgen.
-
Gegenwärtig
ersetzt die globale Hot Spare Platte eine abgetrennte Platte und
rekonstruiert alle Volume-Teile der abgetrennten Platte, sobald
die Bestandteils-Platte in einem nicht-RAID 0 System getrennt wird.
Bei diesem Ansatz werden unnötiger Weise Volume-Teile rekonstruiert
und rückkopiert, die zu Volumes gehören, auf die
in dem Zeitintervall zwischen der Abtrennung der RAID Bestandteils-Platte und
ihrer Wiederverbindung nicht zugegriffen wurde oder die nicht modifiziert
wurden, das heißt, Volumes, die keine I/O-Abfrage erhalten
haben.
-
Demzufolge
ist es Aufgabe der vorliegenden Erfindung, ein System und ein Verfahren
zur Rekonstruktion und zur Rückkopie nur derjeniger Volume-Teile
auf einer abgetrennten Platte bereitzustellen, die Teil von Volumes
waren, die im Zeitintervall zwischen Abtrennung und Wiederverbindung
einer RAID Platte eine I/O-Abfrage erhielten.
-
Demzufolge
ist die vorliegende Erfindung auf ein System und ein Verfahren zur
optimierten Rekonstruktion und Rückkopie der Inhalte einer
abgetrennten RAID Platte gerichtet, die eine globale Hot Spare Platte
nutzen.
-
In
einem ersten Aspekt der vorliegenden Erfindung wird ein System zur
Rekonstruktion und Rückkopie einer ausgefallenen RAID Platte
unter Zuhilfenahme einer globalen Hot Spare Platte offenbart. Das
System umfasst folgendes: Eine Verarbeitungseinheit, die einen Massenspeicher
benötigt; eine oder mehrere Platten, die als RAID-System
konfiguriert sind; eine zugeordnete globale Hot Spare Platte; und
Verbindungen, die die Verarbeitungseinheit, das RAID-System und
die globale Hot Spare Platte miteinander verbinden.
-
In
einem weiteren Aspekt der vorliegenden Erfindung wird ein Verfahren
zur Rekonstruktion und Rückkopie einer abgetrennten RAID
Platte unter Zuhilfenahme einer globalen Hot Spare Platte offenbart. Das
Verfahren umfasst die Schritte: Abtrennen einer RAID Bestandteils-Platte;
Rekonstruieren von Daten von der abgetrennten RAID Platte auf eine
globale Hot Spare Platte; Wiederverbinden der abgetrennten RAID
Bestandteils-Platte; und Kopieren der rekonstruierten Daten von
der globalen Hot Spare Platte zurück auf die wiederverbundene
RAID Bestandteils-Platte.
-
Es
wird angemerkt, dass die Beschreibungseinleitung und die folgende
Figurenbeschreibung nur exemplarisch sind und nicht dazu dienen,
die Patentansprüche einzuschränken. Die zugehörigen
Figuren, die Teil der Figurenbeschreibung sind, veranschaulichen
eine Ausführungsform der Erfindung und dienen zusammen
mit der Beschreibungseinleitung dazu, die Grundprinzipien der vorliegenden
Erfindung zu erklären.
-
Die
zahlreichen Vorteile der vorliegenden Erfindung können
von Durchschnittsfachleuten unter Zuhilfenahme der Figuren besser
verstanden werden.
-
1 ist
eine veranschaulichende Darstellung eines n-Platten RAID Systems
und einer zusätzlichen einsatzbereiten globalen Hot Spare
Platte. Eine Volume-Gruppe, die die n Platten umfasst, weist m individuelle
Volumes auf, wobei jedes Volume in n Teile über die n Platten
aufgeteilt ist.
-
2 ist
eine veranschaulichende Darstellung eines n-Platten RAID Systems
und einer zusätzlichen einsatzbereiten globalen Hot Spare
Platte, wobei eine der n Platten abgetrennt wurde.
-
3 ist
eine veranschaulichende Darstellung einer I/O-Abfrage, die an ein
bestimmtes Volume der Volume-Gruppe gegeben wurde, und das Volume von
einem optimalen Zustand in einen degradierten Zustand übergehen
ließ.
-
4 ist
eine veranschaulichende Darstellung der Integration einer globalen
Hot Spare Platte und der Rekonstruktion eines Volume-Teils eines
Volumes im degradierten Zustand von einer abgetrennten Platte auf
die globale Hot Spare Platte, wobei Daten und Paritätsinformationen
von den Volume-Teilen von den verbleibenden n-1 in Betrieb befindlichen Platten,
die noch in dem RAID System verbunden sind, benutzt wurden.
-
5 ist
eine veranschaulichende Darstellung einer Rückkopie eines
rekonstruierten Volume-Teils von der globalen Hot Spare Platte auf
eine Ersatzplatte für eine ausgefallene Platte.
-
6 ist
ein Flussdiagramm, das zur Veranschaulichung eines Verfahrens zur
Rekonstruktion und Rückkopie einer abgetrennten Platte
in einem RAID System dient, das eine globale Hot Spare Platte nutzt.
-
Die
Erfindung wird im Folgenden anhand der bevorzugten Ausführungsbeispiele
erläutert.
-
Sollte
eine Bestandteils-Platte eines RAID Systems entweder zufällig
oder bewusst, beispielsweise zum Zweck von Wartungsarbeiten, abgetrennt werden,
wird eine globale Hot Spare Platte zum Ersatz des fehlenden Laufwerks
eingesetzt werden. Um die Datenkonsistenz zu erhalten initiiert
das RAID System eine Rekonstruktion der Teile derjeniger Volumes,
die auf dem abgetrennten Laufwerk enthalten sind, sobald eine Verarbeitungseinheit I/O-Abfragen
an eine oder mehrere Volumes im RAID System vornimmt, das heißt
die Volumes werden ”degradiert”. Diese Rekonstruktion
wird durch den Gebrauch von Daten und Paritätsinformationen
erzielt, die auf den verbleibenden in Betrieb befindlichen Platten
vorhanden sind. Nach der Rekonstruktion von den jeweiligen degradierten
Volumes arbeitet die globale Hot Spare Platte als ein Bestandteils-Laufwerk
im RAID System anstelle der abgetrennten Platte im Bezug auf die
degradierten Volumes. Die nicht degradierten Volumes werden nicht
auf die globale Hot Spare Platte rekonstruiert, da keine Veränderung bezüglich
ihrer Inhalte vorgenommen wurde, das heißt keine I/O-Abfragen
an diese Volumes vorgenommen wurden.
-
Sobald
die originale abgetrennte Platte wieder zurück in das RAID
System eingesetzt wird, findet eine Rückkopie von Daten
von der globalen Hot Spare Platte statt. Die Volume-Teile von denjenigen Volumes,
die degradiert wurden und auf die globale Hot Spare Platte rekonstruiert
wurden, werden anstelle der vorherigen Versionen, die sich gegenwärtig auf
der wiederverbundenen Platte befinden, rückkopiert. Die
Volume-Teile von den nicht degradierten Volumes, die sich auf der
abgetrennten Platte befinden, verbleiben ungeändert in
dem Zustand, wie er vor der Abtrennung vorlag.
-
Die
Rekonstruktion und die Rückkopie von nur denjenigen Volumes,
die degradiert wurden während die abgetrennte Platte fehlte,
verkürzt den Zeitaufwand für den Rekonstruktions-/Rückkopierprozess
als Ganzes und daher die Zeit, während der das System nicht
arbeitet. Die ungeänderten optimalen Daten der nicht degradierten
Volumes verbleiben in einem konsistenten Zustand mit oder ohne Rekonstruktion
und Rückkopie. Daher würde eine Rekonstruktion
und ein Rückkopieren der nicht degradierten Volumes den
Rekonstruktions-/Rückkopierprozess unnötig verlängern.
Falls nur eines von zehn logischen Volumes während einer
Plattenabtrennung degradiert wurde, würde die Rekonstruktion
von allen Volumes in eine insgesamte Rekonstruktions-/Rückkopierzeit
münden, die zehnmal länger ist als die tatsächlich
zur Erhaltung der Datenkonsistenz benötigte.
-
Diese
Vorgehensweise reduziert auch den Zeitaufwand, den eine globale
Hot Spare Platte auf eine vorgegebene Volume-Gruppe verwendet. Da eine
globale Hot Spare Platte jeweils nur für eine RAID Bestandteils-Platte
eingesetzt werden kann, kann der gleichzeitige Ausfall von mehreren
RAID Platten nicht gehandhabt werden. Demzufolge ist das Minimieren
der Zeit wünschenswert, in der eine globale Hot Spare Platte
als RAID Bestandteils-Platte benutzt wird.
-
Ein
System nach der vorliegenden Erfindung kann durch Inkorporieren
in die Volume Management Software einer Verarbei tungseinheit, die
einen Massenspeicher benötigt, als Firmware in einem Controller
für ein RAID System oder als eine separate Hardware-Komponente,
die mit einem RAID System in Verbindung steht, implementiert werden.
-
Zusätzliche
Details der vorliegenden Erfindung werden in Beispielen dargelegt,
die in den zugehörigen Zeichnungen veranschaulicht werden.
-
1 zeigt
eine veranschaulichende Darstellung eines Massenspeichersystems 100,
das ein n-Platten, nicht-RAID 0 System 110 und eine zusätzliche
einsatzbereite globale Hot Spare Platte 120 umfasst. Eine
Volume-Gruppe umfasst m individuelle Volumes 130, 140, 150 und 160.
Jedes Volume 130, 140, 150 und 160 umfasst
n individuelle Teile, wobei jedes einzelne davon zu einem der n
Platten des n-Platten RAID Systems zugeordnet ist. Eine Volume Management
Software auf einem externen Gerät 170, das geeignet
ist, I/O-Abfragen zu übermitteln, befähigt das
Gerät, jedes einzelne Volume als ein unabhängiges
Plattenlaufwerk zu behandeln. Dadurch existiert die Möglichkeit,
dass auf bestimmte Volumes 130, 140, 150 oder 160 während
des Zeitintervalls zwischen Abtrennung von einer der n Platten 110 und
ihrer Wiederverbindung nicht zugegriffen wird.
-
2 zeigt
eine veranschaulichende Darstellung eines Massenspeichersystems 200,
das ein n-Platten RAID System 210 umfasst, das eine zusätzliche
einsatzbereite globale Hot Spare Platte 220 aufweist, wobei
eine der n Platten 230 abgetrennt wurde.
-
3 zeigt
eine veranschaulichende Darstellung eines Massenspeichersystems 300,
das ein n-Platten RAID System 310 mit einer zusätzlichen einsatzbereiten
globalen Hot Spare Platte 320 umfasst, wobei eine Platte 330 der
n Platten abgetrennt wurde. Eine I/O-Abfrage 340 wird an
eines oder mehrere der Volumes 350 von einem externen Gerät 360 vorgenommen.
Sobald dies geschieht, erfolgt ein Übergang der Volumes 350,
an die die Abfragen adressiert waren, von einem optimalen Zustand
in einen degradierten Zustand. Dieser Übergang initiiert die
Rekonstruktion der im degradierten Zustand befindlichen Volume-Teile 370,
die sich auf der abgetrennten Platte 330 befinden, auf
die globale Hot Spare Platte 320.
-
4 zeigt
eine veranschaulichende Darstellung eines Massenspeichersystems 400,
das ein n-Platten RAID System 410 mit einer zusätzlichen einsatzbereiten
globalen Hot Spare Platte 420 umfasst, wobei eine der n
Platten 430 abgetrennt wurde. Die globale Hot Spare Platte 420 wurde
als Bestandteils-Platte des n-Platten RAID Systems 410 integriert.
Das Volume-Teil 440 des im degradierten Zustand befindlichen
Volume 460, das sich auf der abgetrennten Platte 430 befindet,
wurde auf die globale Hot Spare Platte 420 rekonstruiert
unter Zuhilfenahme der existierenden Datenblöcke und Paritätsblöcke 450 von
den korrespondierenden Volume-Teilen, die den Rest des degradierten
Volumes 460 umfassen. Die Teile 480 des nicht
degradierten Volumes 470 auf der abgetrennten Platte 430 werden
nicht auf die globale Hot Spare Platte rekonstruiert.
-
5 zeigt
eine veranschaulichende Darstellung eines Massenspeichersystems 500,
das ein n-Platten RAID System 510 mit einer zusätzlichen einsatzbereiten
globalen Hot Spare Platte 520 umfasst, wobei eine vorher
abgetrennte Platte 530 wieder verbunden wurde. Der rekonstruierte
Teil 540 des degradierten Volumes 550 wurde von
der globalen Hot Spare Platte 520 auf das korrespondierende
Volume-Teil 560 der wiederverbundenen RAID Platte 530 rückkopiert.
Nach dem Rückkopieren enthält die wiederverbundene
RAID Platte 530 die rekonstruierten Daten des degradierten
Volume-Teils 560 und die Originaldaten der nicht degradierten
Volume-Teile 570.
-
6 zeigt
ein Flussdiagramm, das das Arbeitsverfahren zur Rekonstruktion und
Rückkopie einer abgetrennten Platte in einem RAID System
unter Zuhilfenahme einer globalen Hot Spare Platte veranschaulicht.
Sobald die Abtrennung einer RAID Platte detektiert worden ist (600),
kann ein einsatzbereites Hot Spare Laufwerk verbunden werden, um
die fehlende RAID Platte zu ersetzen. Sollte ein externes Gerät,
ausgebildet zur Übermittlung von I/O-Abfragen, wie zum
Beispiel eine CPU, eine I/O-Abfrage an das RAID System vornehmen,
wobei ein Volume mit einem Volume-Teil auf der abgetrennten Platte adressiert
wird (610), geht das Volume, an das die Abfrage adressiert
wurde, in einen degradierten Zustand über (620).
Solch ein Übergang initiiert die Rekonstruktion des Volume-Teils
des degradierten Volumes, das sich auf der abgetrennten Platte befindet (630).
Nach der Rekonstruktion bestimmt das System, ob die abgetrennte
Platte wiederverbunden wurde (640). Falls die abgetrennte
RAID Platte nach der Rekonstruktion nicht wiederverbunden wird,
fährt die globale Hot Spare Platte fort, anstelle der abgetrennten
Platte in Beziehung auf das degradierte Volume zu arbeiten. Das
Verfahren kann wiederholt werden (650), falls ein anderes
Volume vor der Wiederverbindung der abgetrennten RAID Platte degradiert
wird. Nach der Wiederverbindung der abgetrennten RAID Platte werden
die rekonstruierten Teile von jedem degradierten Volume auf die
wiederverbundene RAID Platte rückkopiert (660).
-
Es
wird davon ausgegangen, dass die vorliegende Erfindung und zahlreiche
ihrer Vorteile durch die vorhergehende Beschreibung verständlich
gemacht wurden. Es wird auch davon ausge gangen, dass es offensichtlich
ist, dass zahlreiche Änderungen in der Form, dem Aufbau
und der Anordnung deren Bestandteile gemacht werden können,
ohne den Anwendungsbereich und den Grundgedanken der Erfindung zu
verlassen oder ohne alle ihrer wesentlichen Vorteile zu opfern.
Die zuvor beschriebene Form ist lediglich ein erläuterndes
Ausführungsbeispiel. Solche genannten Änderungen
sollen ebenfalls im Schutzbereich der folgenden Ansprüche
enthalten sein.
-
Zusammenfassung
-
Optimierte Rekonstruktion und Rückkopiemethodik für
ein abgetrenntes Laufwerk bei Anwesenheit einer globalen Hot Spare
Platte
-
Die
vorliegende Erfindung ist ein System zur Optimierung der Rekonstruktion
und der Rückkopie von Daten, die auf einer ausgefallenen
Platte in einem Multi-Platten-Massenspeichersystem enthalten sind.
Ein System nach der vorliegenden Erfindung umfasst: Eine Verarbeitungseinheit,
die einen Massenspeicher erfordert; eine oder mehrere Platten, die als
RAID System konfiguriert sind; eine zugeordnete globale Hot Spare
Platte; und Verbindungen, die die Verarbeitungseinheit, das RAID
und die globale Hot Spare Platte miteinander verbinden. Des Weiteren bezieht
sich die Erfindung auf ein Verfahren zur Rekonstruktion und zur
Rückkopie einer abgetrennten RAID Platte unter Zuhilfenahme
einer globalen Hot Spare Platte. Das Verfahren beinhaltet die Schritte: Abtrennen
einer RAID Bestandteils-Platte; Rekonstruieren von Daten von der
abgetrennten RAID Platte auf eine globale Hot Spare Platte; Wiederverbinden der
abgetrennten RAID Bestandteils-Platte und Kopieren der rekonstruierten
Daten von der globalen Hot Spare Platte zurück auf die
wiederverbundene RAID Bestandteils-Platte.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Nicht-Patentliteratur
-
- - Artikel von
Patterson, et al. ”A Case for Redundant Arrays of Inexpensive
Disks (RAID)”, ACM SIGMOD Conference, Juni 1988 [0002]