DE112007002170T5 - Optimierte Rekonstruktion und Rückkopiemethodik für ein abgetrenntes Laufwerk bei Anwesenheit einer globalen Hot Spare Platte - Google Patents

Optimierte Rekonstruktion und Rückkopiemethodik für ein abgetrenntes Laufwerk bei Anwesenheit einer globalen Hot Spare Platte Download PDF

Info

Publication number
DE112007002170T5
DE112007002170T5 DE112007002170T DE112007002170T DE112007002170T5 DE 112007002170 T5 DE112007002170 T5 DE 112007002170T5 DE 112007002170 T DE112007002170 T DE 112007002170T DE 112007002170 T DE112007002170 T DE 112007002170T DE 112007002170 T5 DE112007002170 T5 DE 112007002170T5
Authority
DE
Germany
Prior art keywords
disk
raid
hot spare
global hot
plate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112007002170T
Other languages
English (en)
Inventor
Satish Wichita Sangapu
Kevin Lafayette Kidney
William A. Wichita Hetrick
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LSI Corp
Original Assignee
LSI Logic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LSI Logic Corp filed Critical LSI Logic Corp
Publication of DE112007002170T5 publication Critical patent/DE112007002170T5/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers

Abstract

Datenspeichersystem umfassend:
ein externes Gerät, das einen Massenspeicher benötigt;
ein n-Platten redundantes Array von kostengünstigen Platten (RAID);
eine globale Hot Spare Platte; und
Verbindungen, die das externe Gerät, das RAID und die globale Hot Spare Platte miteinander verbinden,
wobei jede der n Platten individuell abtrennbar ist und
wobei physikalischer Speicherraum des n-Platten RAID in m logische Volumes partitioniert ist, und wobei die Daten, die jedes der m logischen Volumes umfasst, in Teilen über die n Platten verteilt sind.

Description

  • Die vorliegende Erfindung betrifft das Gebiet der redundante Arrays kostengünstiger Festplatten (RAID) Speichersysteme und besonders das Optimieren der Rekonstruktion eines zugehörigen Laufwerks nach seiner Abtrennung.
  • Redundante Arrays kostengünstiger Festplatten (RAID), sind zu wirksamen Werkzeugen zum Beibehalten von Daten innerhalb derzeitiger Computersystemarchitekturen geworden. Ein RAID-System benutzt ein Array von kleinen, kostengünstigen Festplatten, die dazu geeignet sind, Daten unter den verschiedenen Laufwerken zu reproduzieren oder zu verteilen. Eine detaillierte Beschreibung der verschiedenen RAID Level ist in dem Artikel von Patterson, et al. "A Case for Redundant Arrays of Inexpensive Disks (RAID)", ACM SIGMOD Conference, Juni 1988, erhältlich. Dieser Artikel ist hiermit durch Bezugnahme in die vorliegende Anmeldung inkorporiert.
  • Es existieren verschiedene Level von RAID Implementationen. Das einfachste Array, RAID Level 1, umfasst eine oder mehrere Festplatten zur Datenspeicherung und eine gleiche Anzahl von zusätzlichen ”Spiegel”-Festplatten zum Speichern einer Kopie von all den Informationen, die in den Datenfestplatten enthalten sind. Die übrigen RAID Level 2, 3, 4, 5 und 6 unterteilen alle zusammenhängende Daten in Teilstücke zur Speicherung über die verschiedenen Festplatten.
  • RAID Level 2, 3, 4, 5 oder 6 Systeme verteilen diese Daten über die verschiedenen Festplatten in Blöcken. Ein Block besteht aus vielen aufeinander folgenden Sektoren, wobei ein Sektor ein physikalischer Abschnitt eines Festplattenlaufwerks, beinhaltend eine Ansammlung von Bytes, ist. Ein Sektor ist die kleinste Einheit eines Festplattenlaufwerks zum Datentransfer. Sobald ein Datenblock auf eine Festplatte geschrieben worden ist, wird diesem eine Festplattenblocknummer (DBN) zugeteilt. Alle RAID Platten weisen dasselbe DBN System auf, sodass ein Block auf der jeweiligen Platte eine gegebene DBN aufweist. Eine Ansammlung von Blöcken auf den verschiedenen Platten mit derselben DBN sind gemeinsam als Streifen bekannt.
  • Darüber hinaus verwenden viele der derzeitigen Betriebssysteme die Zuteilung von Speicherraum auf Massenspeichergeräten durch Partitionieren dieses Speicherraums in Volumes. Der Begriff ”Volume” bezieht sich auf das logische Gruppieren von physischen Speicherraumelementen, die über eine Vielzahl von Platten und zugehörigen Plattenlaufwerken verteilt sind, wie zum Beispiel in einem RAID System. Volumes sind Teil einer Abstraktion, die eine logische Betrachtungsweise des Speicherraums im Gegensatz zu einer physikalischen Betrachtungsweise des Speicherraums erlaubt. Die meisten Betriebssysteme sehen Volumes so, als ob diese unabhängige Festplattenlaufwerke seien. Volumes werden erzeugt und erhalten durch eine Volume Management Software. Eine Volumegruppe ist eine Ansammlung von verschiedenen Volumes, die eine gemeinsame Gruppe von Laufwerken umfassen.
  • Einer der größten Vorteile eines RAID Systems ist seine Fähigkeit, Daten von einer ausgefallenen Bestandteils-Platte anhand der Information, die auf den verbleibenden in Betrieb befindlichen Platten vorhanden ist, zu rekonstruieren. In den RAID Leveln 3, 4, 5, 6 wird Redundanz durch den Gebrauch von Paritätsblöcken (Parity Blocks) erreicht. Die Daten, die in einem Paritätsblock eines vorgegebenen Streifens enthalten sind, sind das Ergebnis einer Berechnung, die jedes Mal vorgenommen wird, sobald ein Schreiben auf einem Datenblock in dem Streifen erfolgt. Die folgende Gleichung wird gewöhnlicher Weise benutzt, um den nächsten Zustand eines gegebenen Paritätsblocks zu berechnen:
    Neuer Paritätsblock = (alter Datenblock xor neuer Datenblock) xor alter Paritätsblock
  • Der Speicherort dieses Paritätsblocks variiert zwischen den RAID Leveln. RAID Level 3 und RAID Level 4 benutzen eine spezifische Platte, die einzig und allein zur Speicherung von Paritätsblöcken dient. RAID Level 5 und RAID Level 6 überlappen die Paritätsblöcke über all die verschiedenen Platten. RAID Level 6 unterscheidet sich dadurch, dass es zwei Paritätsblöcke pro Streifen aufweist und damit der gleichzeitigen Abtrennung von zwei Platten Rechnung trägt. Falls eine vorgegebene Platte in dem Array abgetrennt wird, können die Datenblöcke und der zugehörige Paritätsblock für einen vorgegebenen Streifen von den verbleibenden Platten kombiniert werden, um die fehlenden Daten zu rekonstruieren.
  • Ein Verfahren, um mit der Abtrennung einer einzelnen Platte in einem RAID System umzugehen, ist die Integration einer globalen Hot Spare Platte (Global Hot Spare Disk). Eine globale Hot Spare Platte ist eine Platte oder eine Gruppe von Platten, die zum Ersatz einer abgetrennten primären Platte in einer RAID Konfiguration dienen. Das Gerät ist eingeschaltet oder wird als ”hot” angesehen, wobei das Gerät jedoch nicht aktiv in das System eingreift. Sobald eine Platte in einem RAID System abgetrennt wird, übernimmt die globale Hot Spare Platte die Aufgabe der abgetrennten Platte und rekonstruiert all die Volume-Teile der fehlenden Platte unter Zuhilfenahme der Datenblöcke und Paritätsblöcke der verbleibenden in Betrieb befindlichen Platten. Sobald die Daten rekonstruiert sind, fungiert die globale Hot Spare Platte als eine Bestandteils-Platte des RAID Systems so lange, bis eine Wiederverbindung der abgetrennten RAID-Platte erfolgt. Sobald die abgetrennte primäre Platte wiederverbunden ist, kann eine Rückkopie der rekonstruierten Daten von der globalen Hot Spare Platte auf die wiederverbundene primäre Platte erfolgen.
  • Gegenwärtig ersetzt die globale Hot Spare Platte eine abgetrennte Platte und rekonstruiert alle Volume-Teile der abgetrennten Platte, sobald die Bestandteils-Platte in einem nicht-RAID 0 System getrennt wird. Bei diesem Ansatz werden unnötiger Weise Volume-Teile rekonstruiert und rückkopiert, die zu Volumes gehören, auf die in dem Zeitintervall zwischen der Abtrennung der RAID Bestandteils-Platte und ihrer Wiederverbindung nicht zugegriffen wurde oder die nicht modifiziert wurden, das heißt, Volumes, die keine I/O-Abfrage erhalten haben.
  • Demzufolge ist es Aufgabe der vorliegenden Erfindung, ein System und ein Verfahren zur Rekonstruktion und zur Rückkopie nur derjeniger Volume-Teile auf einer abgetrennten Platte bereitzustellen, die Teil von Volumes waren, die im Zeitintervall zwischen Abtrennung und Wiederverbindung einer RAID Platte eine I/O-Abfrage erhielten.
  • Demzufolge ist die vorliegende Erfindung auf ein System und ein Verfahren zur optimierten Rekonstruktion und Rückkopie der Inhalte einer abgetrennten RAID Platte gerichtet, die eine globale Hot Spare Platte nutzen.
  • In einem ersten Aspekt der vorliegenden Erfindung wird ein System zur Rekonstruktion und Rückkopie einer ausgefallenen RAID Platte unter Zuhilfenahme einer globalen Hot Spare Platte offenbart. Das System umfasst folgendes: Eine Verarbeitungseinheit, die einen Massenspeicher benötigt; eine oder mehrere Platten, die als RAID-System konfiguriert sind; eine zugeordnete globale Hot Spare Platte; und Verbindungen, die die Verarbeitungseinheit, das RAID-System und die globale Hot Spare Platte miteinander verbinden.
  • In einem weiteren Aspekt der vorliegenden Erfindung wird ein Verfahren zur Rekonstruktion und Rückkopie einer abgetrennten RAID Platte unter Zuhilfenahme einer globalen Hot Spare Platte offenbart. Das Verfahren umfasst die Schritte: Abtrennen einer RAID Bestandteils-Platte; Rekonstruieren von Daten von der abgetrennten RAID Platte auf eine globale Hot Spare Platte; Wiederverbinden der abgetrennten RAID Bestandteils-Platte; und Kopieren der rekonstruierten Daten von der globalen Hot Spare Platte zurück auf die wiederverbundene RAID Bestandteils-Platte.
  • Es wird angemerkt, dass die Beschreibungseinleitung und die folgende Figurenbeschreibung nur exemplarisch sind und nicht dazu dienen, die Patentansprüche einzuschränken. Die zugehörigen Figuren, die Teil der Figurenbeschreibung sind, veranschaulichen eine Ausführungsform der Erfindung und dienen zusammen mit der Beschreibungseinleitung dazu, die Grundprinzipien der vorliegenden Erfindung zu erklären.
  • Die zahlreichen Vorteile der vorliegenden Erfindung können von Durchschnittsfachleuten unter Zuhilfenahme der Figuren besser verstanden werden.
  • 1 ist eine veranschaulichende Darstellung eines n-Platten RAID Systems und einer zusätzlichen einsatzbereiten globalen Hot Spare Platte. Eine Volume-Gruppe, die die n Platten umfasst, weist m individuelle Volumes auf, wobei jedes Volume in n Teile über die n Platten aufgeteilt ist.
  • 2 ist eine veranschaulichende Darstellung eines n-Platten RAID Systems und einer zusätzlichen einsatzbereiten globalen Hot Spare Platte, wobei eine der n Platten abgetrennt wurde.
  • 3 ist eine veranschaulichende Darstellung einer I/O-Abfrage, die an ein bestimmtes Volume der Volume-Gruppe gegeben wurde, und das Volume von einem optimalen Zustand in einen degradierten Zustand übergehen ließ.
  • 4 ist eine veranschaulichende Darstellung der Integration einer globalen Hot Spare Platte und der Rekonstruktion eines Volume-Teils eines Volumes im degradierten Zustand von einer abgetrennten Platte auf die globale Hot Spare Platte, wobei Daten und Paritätsinformationen von den Volume-Teilen von den verbleibenden n-1 in Betrieb befindlichen Platten, die noch in dem RAID System verbunden sind, benutzt wurden.
  • 5 ist eine veranschaulichende Darstellung einer Rückkopie eines rekonstruierten Volume-Teils von der globalen Hot Spare Platte auf eine Ersatzplatte für eine ausgefallene Platte.
  • 6 ist ein Flussdiagramm, das zur Veranschaulichung eines Verfahrens zur Rekonstruktion und Rückkopie einer abgetrennten Platte in einem RAID System dient, das eine globale Hot Spare Platte nutzt.
  • Die Erfindung wird im Folgenden anhand der bevorzugten Ausführungsbeispiele erläutert.
  • Sollte eine Bestandteils-Platte eines RAID Systems entweder zufällig oder bewusst, beispielsweise zum Zweck von Wartungsarbeiten, abgetrennt werden, wird eine globale Hot Spare Platte zum Ersatz des fehlenden Laufwerks eingesetzt werden. Um die Datenkonsistenz zu erhalten initiiert das RAID System eine Rekonstruktion der Teile derjeniger Volumes, die auf dem abgetrennten Laufwerk enthalten sind, sobald eine Verarbeitungseinheit I/O-Abfragen an eine oder mehrere Volumes im RAID System vornimmt, das heißt die Volumes werden ”degradiert”. Diese Rekonstruktion wird durch den Gebrauch von Daten und Paritätsinformationen erzielt, die auf den verbleibenden in Betrieb befindlichen Platten vorhanden sind. Nach der Rekonstruktion von den jeweiligen degradierten Volumes arbeitet die globale Hot Spare Platte als ein Bestandteils-Laufwerk im RAID System anstelle der abgetrennten Platte im Bezug auf die degradierten Volumes. Die nicht degradierten Volumes werden nicht auf die globale Hot Spare Platte rekonstruiert, da keine Veränderung bezüglich ihrer Inhalte vorgenommen wurde, das heißt keine I/O-Abfragen an diese Volumes vorgenommen wurden.
  • Sobald die originale abgetrennte Platte wieder zurück in das RAID System eingesetzt wird, findet eine Rückkopie von Daten von der globalen Hot Spare Platte statt. Die Volume-Teile von denjenigen Volumes, die degradiert wurden und auf die globale Hot Spare Platte rekonstruiert wurden, werden anstelle der vorherigen Versionen, die sich gegenwärtig auf der wiederverbundenen Platte befinden, rückkopiert. Die Volume-Teile von den nicht degradierten Volumes, die sich auf der abgetrennten Platte befinden, verbleiben ungeändert in dem Zustand, wie er vor der Abtrennung vorlag.
  • Die Rekonstruktion und die Rückkopie von nur denjenigen Volumes, die degradiert wurden während die abgetrennte Platte fehlte, verkürzt den Zeitaufwand für den Rekonstruktions-/Rückkopierprozess als Ganzes und daher die Zeit, während der das System nicht arbeitet. Die ungeänderten optimalen Daten der nicht degradierten Volumes verbleiben in einem konsistenten Zustand mit oder ohne Rekonstruktion und Rückkopie. Daher würde eine Rekonstruktion und ein Rückkopieren der nicht degradierten Volumes den Rekonstruktions-/Rückkopierprozess unnötig verlängern. Falls nur eines von zehn logischen Volumes während einer Plattenabtrennung degradiert wurde, würde die Rekonstruktion von allen Volumes in eine insgesamte Rekonstruktions-/Rückkopierzeit münden, die zehnmal länger ist als die tatsächlich zur Erhaltung der Datenkonsistenz benötigte.
  • Diese Vorgehensweise reduziert auch den Zeitaufwand, den eine globale Hot Spare Platte auf eine vorgegebene Volume-Gruppe verwendet. Da eine globale Hot Spare Platte jeweils nur für eine RAID Bestandteils-Platte eingesetzt werden kann, kann der gleichzeitige Ausfall von mehreren RAID Platten nicht gehandhabt werden. Demzufolge ist das Minimieren der Zeit wünschenswert, in der eine globale Hot Spare Platte als RAID Bestandteils-Platte benutzt wird.
  • Ein System nach der vorliegenden Erfindung kann durch Inkorporieren in die Volume Management Software einer Verarbei tungseinheit, die einen Massenspeicher benötigt, als Firmware in einem Controller für ein RAID System oder als eine separate Hardware-Komponente, die mit einem RAID System in Verbindung steht, implementiert werden.
  • Zusätzliche Details der vorliegenden Erfindung werden in Beispielen dargelegt, die in den zugehörigen Zeichnungen veranschaulicht werden.
  • 1 zeigt eine veranschaulichende Darstellung eines Massenspeichersystems 100, das ein n-Platten, nicht-RAID 0 System 110 und eine zusätzliche einsatzbereite globale Hot Spare Platte 120 umfasst. Eine Volume-Gruppe umfasst m individuelle Volumes 130, 140, 150 und 160. Jedes Volume 130, 140, 150 und 160 umfasst n individuelle Teile, wobei jedes einzelne davon zu einem der n Platten des n-Platten RAID Systems zugeordnet ist. Eine Volume Management Software auf einem externen Gerät 170, das geeignet ist, I/O-Abfragen zu übermitteln, befähigt das Gerät, jedes einzelne Volume als ein unabhängiges Plattenlaufwerk zu behandeln. Dadurch existiert die Möglichkeit, dass auf bestimmte Volumes 130, 140, 150 oder 160 während des Zeitintervalls zwischen Abtrennung von einer der n Platten 110 und ihrer Wiederverbindung nicht zugegriffen wird.
  • 2 zeigt eine veranschaulichende Darstellung eines Massenspeichersystems 200, das ein n-Platten RAID System 210 umfasst, das eine zusätzliche einsatzbereite globale Hot Spare Platte 220 aufweist, wobei eine der n Platten 230 abgetrennt wurde.
  • 3 zeigt eine veranschaulichende Darstellung eines Massenspeichersystems 300, das ein n-Platten RAID System 310 mit einer zusätzlichen einsatzbereiten globalen Hot Spare Platte 320 umfasst, wobei eine Platte 330 der n Platten abgetrennt wurde. Eine I/O-Abfrage 340 wird an eines oder mehrere der Volumes 350 von einem externen Gerät 360 vorgenommen. Sobald dies geschieht, erfolgt ein Übergang der Volumes 350, an die die Abfragen adressiert waren, von einem optimalen Zustand in einen degradierten Zustand. Dieser Übergang initiiert die Rekonstruktion der im degradierten Zustand befindlichen Volume-Teile 370, die sich auf der abgetrennten Platte 330 befinden, auf die globale Hot Spare Platte 320.
  • 4 zeigt eine veranschaulichende Darstellung eines Massenspeichersystems 400, das ein n-Platten RAID System 410 mit einer zusätzlichen einsatzbereiten globalen Hot Spare Platte 420 umfasst, wobei eine der n Platten 430 abgetrennt wurde. Die globale Hot Spare Platte 420 wurde als Bestandteils-Platte des n-Platten RAID Systems 410 integriert. Das Volume-Teil 440 des im degradierten Zustand befindlichen Volume 460, das sich auf der abgetrennten Platte 430 befindet, wurde auf die globale Hot Spare Platte 420 rekonstruiert unter Zuhilfenahme der existierenden Datenblöcke und Paritätsblöcke 450 von den korrespondierenden Volume-Teilen, die den Rest des degradierten Volumes 460 umfassen. Die Teile 480 des nicht degradierten Volumes 470 auf der abgetrennten Platte 430 werden nicht auf die globale Hot Spare Platte rekonstruiert.
  • 5 zeigt eine veranschaulichende Darstellung eines Massenspeichersystems 500, das ein n-Platten RAID System 510 mit einer zusätzlichen einsatzbereiten globalen Hot Spare Platte 520 umfasst, wobei eine vorher abgetrennte Platte 530 wieder verbunden wurde. Der rekonstruierte Teil 540 des degradierten Volumes 550 wurde von der globalen Hot Spare Platte 520 auf das korrespondierende Volume-Teil 560 der wiederverbundenen RAID Platte 530 rückkopiert. Nach dem Rückkopieren enthält die wiederverbundene RAID Platte 530 die rekonstruierten Daten des degradierten Volume-Teils 560 und die Originaldaten der nicht degradierten Volume-Teile 570.
  • 6 zeigt ein Flussdiagramm, das das Arbeitsverfahren zur Rekonstruktion und Rückkopie einer abgetrennten Platte in einem RAID System unter Zuhilfenahme einer globalen Hot Spare Platte veranschaulicht. Sobald die Abtrennung einer RAID Platte detektiert worden ist (600), kann ein einsatzbereites Hot Spare Laufwerk verbunden werden, um die fehlende RAID Platte zu ersetzen. Sollte ein externes Gerät, ausgebildet zur Übermittlung von I/O-Abfragen, wie zum Beispiel eine CPU, eine I/O-Abfrage an das RAID System vornehmen, wobei ein Volume mit einem Volume-Teil auf der abgetrennten Platte adressiert wird (610), geht das Volume, an das die Abfrage adressiert wurde, in einen degradierten Zustand über (620). Solch ein Übergang initiiert die Rekonstruktion des Volume-Teils des degradierten Volumes, das sich auf der abgetrennten Platte befindet (630). Nach der Rekonstruktion bestimmt das System, ob die abgetrennte Platte wiederverbunden wurde (640). Falls die abgetrennte RAID Platte nach der Rekonstruktion nicht wiederverbunden wird, fährt die globale Hot Spare Platte fort, anstelle der abgetrennten Platte in Beziehung auf das degradierte Volume zu arbeiten. Das Verfahren kann wiederholt werden (650), falls ein anderes Volume vor der Wiederverbindung der abgetrennten RAID Platte degradiert wird. Nach der Wiederverbindung der abgetrennten RAID Platte werden die rekonstruierten Teile von jedem degradierten Volume auf die wiederverbundene RAID Platte rückkopiert (660).
  • Es wird davon ausgegangen, dass die vorliegende Erfindung und zahlreiche ihrer Vorteile durch die vorhergehende Beschreibung verständlich gemacht wurden. Es wird auch davon ausge gangen, dass es offensichtlich ist, dass zahlreiche Änderungen in der Form, dem Aufbau und der Anordnung deren Bestandteile gemacht werden können, ohne den Anwendungsbereich und den Grundgedanken der Erfindung zu verlassen oder ohne alle ihrer wesentlichen Vorteile zu opfern. Die zuvor beschriebene Form ist lediglich ein erläuterndes Ausführungsbeispiel. Solche genannten Änderungen sollen ebenfalls im Schutzbereich der folgenden Ansprüche enthalten sein.
  • Zusammenfassung
  • Optimierte Rekonstruktion und Rückkopiemethodik für ein abgetrenntes Laufwerk bei Anwesenheit einer globalen Hot Spare Platte
  • Die vorliegende Erfindung ist ein System zur Optimierung der Rekonstruktion und der Rückkopie von Daten, die auf einer ausgefallenen Platte in einem Multi-Platten-Massenspeichersystem enthalten sind. Ein System nach der vorliegenden Erfindung umfasst: Eine Verarbeitungseinheit, die einen Massenspeicher erfordert; eine oder mehrere Platten, die als RAID System konfiguriert sind; eine zugeordnete globale Hot Spare Platte; und Verbindungen, die die Verarbeitungseinheit, das RAID und die globale Hot Spare Platte miteinander verbinden. Des Weiteren bezieht sich die Erfindung auf ein Verfahren zur Rekonstruktion und zur Rückkopie einer abgetrennten RAID Platte unter Zuhilfenahme einer globalen Hot Spare Platte. Das Verfahren beinhaltet die Schritte: Abtrennen einer RAID Bestandteils-Platte; Rekonstruieren von Daten von der abgetrennten RAID Platte auf eine globale Hot Spare Platte; Wiederverbinden der abgetrennten RAID Bestandteils-Platte und Kopieren der rekonstruierten Daten von der globalen Hot Spare Platte zurück auf die wiederverbundene RAID Bestandteils-Platte.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Nicht-Patentliteratur
    • - Artikel von Patterson, et al. ”A Case for Redundant Arrays of Inexpensive Disks (RAID)”, ACM SIGMOD Conference, Juni 1988 [0002]

Claims (21)

  1. Datenspeichersystem umfassend: ein externes Gerät, das einen Massenspeicher benötigt; ein n-Platten redundantes Array von kostengünstigen Platten (RAID); eine globale Hot Spare Platte; und Verbindungen, die das externe Gerät, das RAID und die globale Hot Spare Platte miteinander verbinden, wobei jede der n Platten individuell abtrennbar ist und wobei physikalischer Speicherraum des n-Platten RAID in m logische Volumes partitioniert ist, und wobei die Daten, die jedes der m logischen Volumes umfasst, in Teilen über die n Platten verteilt sind.
  2. Datenspeichersystem nach Anspruch 1, wobei eine der n Platten abgetrennt ist.
  3. Datenspeichersystem nach Anspruch 2, wobei eine input- oder Output- (I/O) Abfrage von dem externen Gerät auf eines oder mehrere logische Volumes des n-Platten RAID zugreift oder diese modifiziert.
  4. Datenspeichersystem nach Anspruch 3, wobei die Teile der zugegriffenen oder modifizierten logischen Volumes, die sich auf der abgetrennten Platte befinden, auf der globalen Hot Spare Platte rekonstruiert sind.
  5. Datenspeichersystem nach Anspruch 4, wobei die globale Hot Spare Platte als Bestandteils-Platte in dem n-Platten RAID bezüglich der rekonstruierten logischen Volume-Teile arbeitet während die abgetrennte Platte abgetrennt bleibt.
  6. Datenspeichersystem nach Anspruch 4, wobei die rekonstruierten logischen Volume-Teile auf die abgetrennte Platte nach ihrer Rückverbindung rückkopiert sind.
  7. Datenspeichersystem nach Anspruch 4, wobei die Rekonstruktion mithilfe von existierenden Datenblöcken und Paritätsblöcken von den verbleibenden n-1 verbundenen Platten in dem n-Platten RAID erfolgt.
  8. Verfahren zur Rekonstruktion von Inhalten von einer abgetrennten Platte in einem n-Platten redundanten Array von kostengünstigen Platten (RAID), wobei das Verfahren die Schritte beinhaltet: Detektieren einer Abtrennung von einer der n Platten eines n-Platten RAIDs; Empfangen von einem oder mehreren Eingangssignalen von einem externen Gerät; Übergehen eines oder mehrerer logischer Volumes von einem optimalen Zustand in einen degradierten Zustand; Rekonstruieren degradierter Volume-Teile der abgetrennten Platte; Wiederverbinden der abgetrennten Platte; Kopieren der rekonstruierten degradierten Volume-Teile auf die wiederverbundene Platte.
  9. Verfahren nach Anspruch 8, wobei das Eingangssignal eine Abfrage zum Zugang oder zur Modifizierung von Daten ist, die in einem oder mehreren logischen Volumes befindlich sind.
  10. Verfahren nach Anspruch 9, wobei der Übergang eines logischen Volumes von einem optimalen Zustand in einen degradierten Zustand erfolgt, sobald auf die Inhalte der logischen Volumes zugegriffen wird oder die Inhalte der logischen Volumes modifiziert werden.
  11. Verfahren nach Anspruch 8, wobei der Bestimmungsort der rekonstruierten degradierten Volume-Teile eine globale Hot Spare Platte ist.
  12. Verfahren nach Anspruch 11, wobei die globale Hot Spare Platte als Bestandteils-Platte in dem n-Platten RAID in Beziehung auf die rekonstruierten degradierten logischen Volume-Teile arbeitet während die abgetrennte Platte abgetrennt bleibt.
  13. Verfahren nach Anspruch 11, wobei die rekonstruierten degradierten Volume-Teile auf die wiederverbundene Platte kopiert werden.
  14. Verfahren nach Anspruch 8, wobei die Rekonstruktion durch den Gebrauch existierender Datenblöcke und Paritätsblöcke von den verbleibenden n-1 verbundenen Platten in dem n-Platten RAID erfolgt.
  15. Computerlesbares Medium mit computerlesbaren Instruktionen, die auf dem Medium abgelegt sind zur Ausführung durch einen Prozessor, um ein Verfahren auszuführen, wobei das Verfahren folgende Schritte umfasst: Detektieren einer Abtrennung von einer. von n Platten eines n-Platten RAIDS; Empfangen eines Eingangssignals von einem externen Gerät; Übergehen von einem oder mehreren logischen Volumes von einem optimalen Zustand zu einem degradierten Zustand; Rekonstruieren degradierter logischer Volume-Teile der abgetrennten Platte auf einer globalen Hot Spare Platte; Wiederverbinden der abgetrennten Platte; Kopieren der Volume-Teile, die auf der globalen Hot Spare Platte rekonstruiert sind, auf die wiederverbundene Platte in dem n-Platten RAID.
  16. Medium nach Anspruch 15, wobei das Eingangssignal eine Abfrage zum Zugang oder zum Modifizieren von Daten ist, die in einem oder mehreren logischen Volumes angeordnet sind.
  17. Medium nach Anspruch 16, wobei der Übergang von einem logischen Volume von einem optimalen Zustand zu einem degradierten Zustand erfolgt, sobald auf die Inhalte der logischen Volumes zugegriffen wird oder die Inhalte der logischen Volumes modifiziert werden.
  18. Medium nach Anspruch 15, wobei der Bestimmungsort der rekonstruierten degradierten Volume-Teile die globale Hot Spare Platte ist.
  19. Medium nach Anspruch 18, wobei die globale Hot Spare Platte als Bestandteils-Platte in dem n-Platten RAID im Hinblick auf die rekonstruierten Volume-Teile arbeitet, während die abgetrennte Platte abgetrennt bleibt.
  20. Medium nach Anspruch 18, wobei die rekonstruierten degradierten Volume-Teile von der globalen Hot Spare Platte auf die wiederverbundene Platte kopiert werden.
  21. Medium nach Anspruch 15, wobei die Rekonstruktion durch den Gebrauch von existierenden Datenblöcken und Pari tätsblöcken von den verbleibenden n-1 verbundenen Platten in dem n-Platten RAID erfolgt.
DE112007002170T 2006-09-18 2007-09-18 Optimierte Rekonstruktion und Rückkopiemethodik für ein abgetrenntes Laufwerk bei Anwesenheit einer globalen Hot Spare Platte Withdrawn DE112007002170T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/522,777 2006-09-18
US11/522,777 US7805633B2 (en) 2006-09-18 2006-09-18 Optimized reconstruction and copyback methodology for a disconnected drive in the presence of a global hot spare disk
PCT/US2007/020308 WO2008036319A2 (en) 2006-09-18 2007-09-18 Optimized reconstruction and copyback methodology for a disconnected drive in the presence of a global hot spare disk

Publications (1)

Publication Number Publication Date
DE112007002170T5 true DE112007002170T5 (de) 2009-09-10

Family

ID=39201616

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112007002170T Withdrawn DE112007002170T5 (de) 2006-09-18 2007-09-18 Optimierte Rekonstruktion und Rückkopiemethodik für ein abgetrenntes Laufwerk bei Anwesenheit einer globalen Hot Spare Platte

Country Status (7)

Country Link
US (1) US7805633B2 (de)
JP (1) JP5285611B2 (de)
KR (1) KR101251245B1 (de)
CN (1) CN101517542A (de)
DE (1) DE112007002170T5 (de)
GB (1) GB2455256B (de)
WO (1) WO2008036319A2 (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080126839A1 (en) * 2006-09-19 2008-05-29 Satish Sangapu Optimized reconstruction and copyback methodology for a failed drive in the presence of a global hot spare disc
US7626827B2 (en) * 2007-09-07 2009-12-01 Kla-Tencor Corporation High density in-package microelectronic amplifier
US8612678B2 (en) * 2008-04-30 2013-12-17 Netapp, Inc. Creating logical disk drives for raid subsystems
JP5056747B2 (ja) * 2008-12-25 2012-10-24 富士通株式会社 記憶領域管理装置、記憶領域管理方法
CN101441668B (zh) * 2008-12-31 2011-09-21 中兴通讯股份有限公司 分布式文件系统中多磁盘分组热备的方法与装置
JP4842334B2 (ja) * 2009-02-12 2011-12-21 富士通株式会社 ディスクアレイ制御装置
US8065558B2 (en) * 2009-03-24 2011-11-22 Lsi Corporation Data volume rebuilder and methods for arranging data volumes for improved RAID reconstruction performance
CN101599032A (zh) * 2009-05-31 2009-12-09 成都市华为赛门铁克科技有限公司 存储节点管理方法、控制子系统和存储系统
US8689040B2 (en) * 2010-10-01 2014-04-01 Lsi Corporation Method and system for data reconstruction after drive failures
US9823876B2 (en) 2015-09-29 2017-11-21 Seagate Technology Llc Nondisruptive device replacement using progressive background copyback operation
EP3537687B1 (de) 2017-03-29 2021-09-22 Huawei Technologies Co., Ltd. Zugriffsverfahren für verteiltes speichersystem, zugehörige vorrichtung und zugehöriges system
US10733052B2 (en) * 2017-12-21 2020-08-04 International Business Machines Corporation Accelerated rebuilding of storage arrays
CN109799953B (zh) * 2018-12-14 2022-10-11 深圳创新科技术有限公司 一种快速重建raid的方法和装置
CN111221709B (zh) * 2020-04-17 2020-08-25 湖南兴天电子科技有限公司 服务器维护方法、装置、计算机设备和可读存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210866A (en) * 1990-09-12 1993-05-11 Storage Technology Corporation Incremental disk backup system for a dynamically mapped data storage subsystem
JP2603757B2 (ja) * 1990-11-30 1997-04-23 富士通株式会社 アレ−ディスク装置の制御方法
US5371882A (en) * 1992-01-14 1994-12-06 Storage Technology Corporation Spare disk drive replacement scheduling system for a disk drive array data storage subsystem
JPH07141120A (ja) * 1993-11-16 1995-06-02 Nippon Telegr & Teleph Corp <Ntt> 情報記憶媒体障害処理方法
US5606359A (en) * 1994-06-30 1997-02-25 Hewlett-Packard Company Video on demand system with multiple data sources configured to provide vcr-like services
US5941994A (en) * 1995-12-22 1999-08-24 Lsi Logic Corporation Technique for sharing hot spare drives among multiple subsystems
US6178520B1 (en) * 1997-07-31 2001-01-23 Lsi Logic Corporation Software recognition of drive removal or insertion in a storage system
US6341333B1 (en) * 1997-10-06 2002-01-22 Emc Corporation Method for transparent exchange of logical volumes in a disk array storage device
JP3184171B2 (ja) * 1998-02-26 2001-07-09 日本電気株式会社 ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
WO2002065298A1 (en) * 2001-02-13 2002-08-22 Candera, Inc. Silicon-based storage virtualization server
US6880101B2 (en) * 2001-10-12 2005-04-12 Dell Products L.P. System and method for providing automatic data restoration after a storage device failure
US6836820B1 (en) * 2002-02-25 2004-12-28 Network Appliance, Inc. Flexible disabling of disk sets
US6789165B2 (en) * 2002-05-10 2004-09-07 International Business Machines Corporation Data storage array method and system
US20030217305A1 (en) * 2002-05-14 2003-11-20 Krehbiel Stanley E. System, method, and computer program product within a data processing system for assigning an unused, unassigned storage device as a replacement device
US7058762B2 (en) * 2003-06-09 2006-06-06 Hewlett-Packard Development Company, L.P. Method and apparatus for selecting among multiple data reconstruction techniques
US20050283654A1 (en) * 2004-05-24 2005-12-22 Sun Microsystems, Inc. Method and apparatus for decreasing failed disk reconstruction time in a raid data storage system
US20070088990A1 (en) * 2005-10-18 2007-04-19 Schmitz Thomas A System and method for reduction of rebuild time in raid systems through implementation of striped hot spare drives
US7661012B2 (en) * 2005-12-01 2010-02-09 International Business Machines Corporation Spare device management

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Artikel von Patterson, et al. "A Case for Redundant Arrays of Inexpensive Disks (RAID)", ACM SIGMOD Conference, Juni 1988

Also Published As

Publication number Publication date
US7805633B2 (en) 2010-09-28
CN101517542A (zh) 2009-08-26
GB2455256B (en) 2011-04-27
JP2010503941A (ja) 2010-02-04
KR101251245B1 (ko) 2013-04-08
JP5285611B2 (ja) 2013-09-11
GB0904995D0 (en) 2009-05-06
WO2008036319A3 (en) 2008-11-27
KR20090096406A (ko) 2009-09-10
GB2455256A (en) 2009-06-10
US20080126838A1 (en) 2008-05-29
WO2008036319A2 (en) 2008-03-27

Similar Documents

Publication Publication Date Title
DE112007002170T5 (de) Optimierte Rekonstruktion und Rückkopiemethodik für ein abgetrenntes Laufwerk bei Anwesenheit einer globalen Hot Spare Platte
DE112007002175T5 (de) Optimierte Rekonstruktion und Rückkopiemethodik für ein ausgefallenes Laufwerk bei Anwesenheit einer globalen Hot Spare Platte
DE60318687T2 (de) Herstellen einer gespiegelten kopie unter verwendung inkrementeller divergenz
DE19581103C2 (de) Verfahren und Vorrichtung zur Echtzeit-Rekonstruktion zerstörter Daten in einem Speichersystem mit redundanter Anordnung
DE69629444T2 (de) Datenverarbeitungsgerät und Verfahren zur Ersetzung von ausgefallenen Speichereinheiten
DE69831944T2 (de) Vorrichtung und verfahren zur sicherung eines plattenspeichersystem
DE602005004120T2 (de) System und verfahren zur übernahme von partnerbetriebsmitteln in verbindung mit coredump
DE102005012448B4 (de) System und Verfahren zur Wiederherstellung eines Laufwerks nach einem Ausfall eines Laufwerks
DE69735400T2 (de) Speicherplattenanordnung
DE69817696T2 (de) Warmaustausch von gespiegeltem Nachschreib-Cachespeicher
DE04812807T1 (de) Virtual File System
DE112010003345T5 (de) Datenspeichersystem und Verfahren für das Betreiben eines Datenspeichersystems
DE112018004275T5 (de) Raid-array-wiederherstellungsunterstützung anhand einer externen array-kopie
DE112011100623T5 (de) Read-Other-Protokoll zur Aufrechterhaltung der Paritätskohärenz in einem Writeback-Datenspeichersystem mit verteilter Redundanz
DE10297430T5 (de) Datenspiegelung unter Anwendung von shared Bussen
DE102004025922A1 (de) Die Laufwerks-Betriebszeit optimierendes Plattenarray
DE112010003794T5 (de) Datenspeicherung unter Verwendung von Bitmaps
DE4422786A1 (de) Speichersystem
CN103136074A (zh) 多个磁盘阵列系统的数据储存方法及数据储存系统
CN101567211A (zh) 一种提高磁盘可用性的方法和磁盘阵列控制器
DE112019005408B4 (de) Masterloses raid für byte-adressierbaren nichtflüchtigen speicher
DE60310530T2 (de) Eine Speicherplattenanordnung basierend auf Festplatten mit Zugriffseinheiten fester Länge
DE60303468T2 (de) Fehlertolerante Vorrichtung zur Informationsverarbeitung
DE69727173T2 (de) Magnetplattenspeicheranordnungssteuerverfahren, Plattennetzanordnungssteuerverfahren und Plattennetzanordnung
DE112018003165T5 (de) System und verfahren zum umschalten von firmware

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: LSI CORP., MILPITAS, CALIF., US

R016 Response to examination communication
R082 Change of representative

Representative=s name: DILG HAEUSLER SCHINDELMANN PATENTANWALTSGESELL, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee