DE19827432A1 - Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert - Google Patents
Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordertInfo
- Publication number
- DE19827432A1 DE19827432A1 DE19827432A DE19827432A DE19827432A1 DE 19827432 A1 DE19827432 A1 DE 19827432A1 DE 19827432 A DE19827432 A DE 19827432A DE 19827432 A DE19827432 A DE 19827432A DE 19827432 A1 DE19827432 A1 DE 19827432A1
- Authority
- DE
- Germany
- Prior art keywords
- computer
- data
- main memory
- status data
- platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1441—Resetting or repowering
Description
Die Erfindung betrifft ein Verfahren zur Speicherung von den
Zustand eines Rechners bei einem gravierenden Störfall be
schreibenden Daten, die anschließend zur Fehleranalyse und
gegebenenfalls Behebung eingesetzt werden können. Solche gra
vierenden Störfälle können zum Beispiel durch Software- oder
Hardwarefehler hervorgerufen werden und verhindern dann einen
weiteren Normalbetrieb bzw. können gegebenenfalls auch zum
gesamten Rechnerabsturz führen. Im allgemeinen sind hierbei
keine Zustandsdaten vorhanden, die den Rechnerzustand unmit
telbar vor und während des Störfalls protokollieren würden.
Daher fehlt im allgemeinen die Möglichkeit, die Absturzursa
che und auch den Fehler zu lokalisieren.
Hinzu tritt, daß manche Rechnereinheiten im Echtzeitbetrieb
ständig verfügbar sein müssen, zum Beispiel bei digitalen
Fernsprechvermittlungssystemen. Ein solcher Rechner wird nach
einem Absturz normalerweise automatisch so fort wieder hochge
fahren, wobei teilweise auch der Hauptspeicher neu formatiert
wird. Ein weiteres Problem besteht auch darin, daß aufgrund
der sofortigen Wiederinbetriebnahme des Rechners keine Mög
lichkeit zur Fehlersuche verbleibt. Es ist daher sehr mühsam,
die Absturzursache, das heißt Hardware- oder Softwarefehler,
zielstrebig zu analysieren und zu beheben.
Zur Bereitstellung von Rechner-Zustandsinformationen unmit
telbar vor einem gravierenden Störfall könnte überlegt wer
den, während des Normalbetriebs ständig Daten über den Rech
nerzustand zu protokollieren, um hieraus nach einem gravie
renden Störfall die Fehlerursache analysieren zu können. Je
doch können solche Daten aus Dynamikgründen nicht sofort ex
tern, zum Beispiel auf einer Festplatte, gesichert werden, da
ansonsten die Leistungsperformance des Rechners zu stark ein
geschränkt würde. Solche Daten müßten daher periodisch oder
bei Erreichen eines bestimmten Volumens, das heißt in größe
ren Zeitabständen gesichert werden. Bei Auftreten eines gra
vierenden Störfalls, der zu einem Wiederanlaufen des Rechners
führt, wird dann aber häufig auch der Hauptspeicher neu for
matiert, so daß dann die dort noch enthaltenen Zustandsinfor
mationen überschrieben werden. Es fehlen dann aber die Zu
standsinformationen für den kritischsten Zeitbereich, nämlich
für den Zeitbereich zwischen dem letzten Sicherungszeitpunkt
und dem Zeitpunkt des Störfalls, so daß die Fehleranalyse nur
auf unvollständigem Datenmaterial beruhen kann.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur
effektiven Speicherung von eine gute Fehleranalyse ermögli
chenden Rechnerzustandsinformationen bei einem Störfall be
reitzustellen.
Diese Aufgabe wird mit den im Patentanspruch 1 genannten Maß
nahmen gelöst. Vorteilhafte Ausgestaltungen der Erfindung
sind in den Unteransprüchen angegeben.
Bei dem erfindungsgemäßen Verfahren werden somit ständig In
formationen über den Zustand des Rechners (Rechnerzu
standsdaten) im Hauptspeicher gesammelt. Diese Informationen
repräsentieren relevante Informationen aus jeweils gerade in
Verarbeitung befindlichen oder laufenden Programmeinheiten
und/oder Informationen über den Zustand von Hardwareeinhei
ten, insbesondere von Fehlersignale generierenden Hardware
komponenten. Damit steht im Hauptspeicher stets ein Informa
tionsbereich zur Verfügung, der bei einem leichteren, kein
Wieder-Hochfahren des Rechners erfordernden Störfall unmit
telbar oder zu einem geeigneten Zeitpunkt ausgewertet werden
kann, um hierdurch Fehler in den Software- und/oder Hardware
komponenten zu analysieren und auszumerzen.
Wenn jedoch ein gravierender Störfall auftritt, der ein An
laufen des Rechners mit vollständiger oder teilweiser Forma
tierung des Hauptspeichers erfordert, würden diese Rechnerzu
standsdaten im Hauptspeicher überschrieben werden, so daß die
Informationen verloren gehen und keine Fehleranalyse mehr er
möglichen. Zur Lösung dieses Problems ist bei dem erfindungs
gemäßen Verfahren ein zusätzlicher Programmabschnitt vorgese
hen, der eine Umspeicherung der Rechnerzustandsdaten von dem
Hauptspeicher auf einen anderen Datenträger, zum Beispiel auf
die Festplatte, bewirkt. Diese Umspeicherung wird in der An
fangsphase des Hochfahrens noch vor dem Formatieren des
Hauptspeichers und insbesondere noch vor dem Laden des Be
triebssystems ausgeführt, das heißt in einem Zustand, bei dem
der Hauptspeicherinhalt und damit die Rechnerzustandsdaten
noch unverändert ist. Diese Rechnerzustandsdaten stehen dem
zufolge auch nach dem Hochfahren des Rechners für eine sofor
tige oder auch spätere Fehleranalyse zur Verfügung, die in
tern oder extern durchgeführt werden kann. Da die Rechnerzu
standsdaten bis unmittelbar zu dem Auftreten des Störfalls
fortgeschrieben worden sind, beinhalten sie auch die aktuell
sten Informationen, die eine bestmögliche Fehleranalyse zu
lassen.
Bei einer Ausführungsform der Erfindung werden die Speicher
bereiche des Hauptspeichers, in denen die Rechnerzustandsda
ten gespeichert sind und die somit eine Datensammlungs-Tabel
le bilden, einer zentralen Umspeicherfunktion insbesondere
durch Übergabe der Hauptspeicheradresse und der Länge des
Speicherbereichs mitgeteilt. Die Umspeicherfunktion ist hier
bei derart ausgelegt, daß sie auch ohne Betriebssystemunter
stützung arbeiten kann, da das Betriebssystem möglicherweise
ebenfalls fehlerhaft sein kann bzw. eine verfälschte Daten
haltung bewirkt. Die Umspeicherfunktion ist daher vorzugswei
se softwaretechnisch als autonomer Abschnitt in den untersten
Software-Schichten unterhalb des Betriebssystems realisiert.
Die Umspeicherfunktion ist vorzugsweise in der Boot-Stufe an
gesiedelt, das heißt liegt in der "Urlade-Software". Bei Auf
treten einer schwerwiegenden Störung wird als Reaktion die
Urladephase durchlaufen, so daß die Umspeicherfunktion ange
stoßen wird und sich die Rechnerzustandsdaten aus dem ihr
mitgeteilten Hauptspeicherbereich ausliest und über eine ele
mentare Ein-/Ausgabe-Schnittstelle auf einen externen Daten
träger ausgibt. Dieser Vorgang kann zeitlich optimal inner
halb von wenigen Sekunden ablaufen, da die entsprechenden Da
tenbereiche kompakt sehr rasch transferiert werden können und
der Transport unmittelbar, das heißt ohne weiteren System-
Overhead, abläuft.
Theoretisch könnte auch überlegt werden, die die Rechnerzu
standsdaten enthaltenden Hauptspeicherbereiche bei der Spei
cher-Neuformatierung auszuklammern, um ein Überschreiben die
ser Daten zu verhindern. Jedoch könnte sich hierbei das mit
der vorliegenden Erfindung vermiedene Problem ergeben, daß
bei eventuellen, durch Systemfehler bedingten Verfälschungen
dieser Daten der Rechner nach dem Hochlaufen aufgrund dieser
verfälschten Hauptspeicher-Dateninhalte erneut fehlerhaft ar
beitet und eventuell wieder abstürzt.
Aufgrund der erfindungsgemäßen Vorgehensweise können auch die
Rechnerzustandsdaten-Speicherbereiche des Hauptspeichers nach
der Umspeicherung neu formatiert werden, so daß in diesen
Speicherbereichen eventuell vorhandene Datenverfälschungen
neutralisiert werden.
Darüber hinaus ist bei schwereren Störfällen eine Neuforma
tierung des gesamten Hauptspeichers unumgänglich, wobei auch
solche für die Rechnerzustandsdaten reservierten Speicherbe
reiche formatiert werden müssen.
Ferner läßt sich bei der erfindungsgemäßen Vorgehensweise der
zu sicherende Speicherbereich durch fest programmierte Daten
schnitt stellen, das heißt durch Pointer auf Datenstrukturen,
festlegen, so daß auch Erweiterungen des benötigten Speicher
platzes stets unter zentraler Kontrolle durchgeführt werden.
Durch die strikte Kontrolle des Rechnerzustandsdaten-Spei
cherbereichs ist es darüber hinaus auch präzise möglich, die
durch Umspeicherung gesicherten Rechnerzustandsdaten in les
bare Form aufzubereiten. Die gesicherten Informationen sind
nämlich im allgemeinen binär und damit nicht lesbar. In vor
teilhafter Ausgestaltung werden diese Rechnerzustandsdaten
daher nach erfolgreichem Hochlauf wieder von dem externen Da
tenträger, zum Beispiel der Platte, eingelesen und aufberei
tet und hierdurch in eine lesbare, symbolische Form gebracht.
Anhand dieser aufbereiteten Daten läßt sich dann die Fehler
suche und -analyse durchführen. Die aufbereiteten Daten las
sen sich ihrerseits auf einem Datenträger, zum Beispiel auf
der Festplatte, abspeichern, und stehen in diesem Fall auch
für eine eventuelle spätere Fehleranalyse oder eine Fehler
protokollierung zur Verfügung. Die Datenaufbereitungsfunktion
muß jedoch nicht zwingend im Rechner selbst On-Line stattfin
den, sondern kann auch Off-Line erfolgen.
Bei dem erfindungsgemäßen Verfahren wird somit die Umspei
cherfunktion auf einer Ebene unterhalb des Betriebssystems
bereitgestellt und erlaubt eine effektive Sicherung der rele
vanten Rechnerzustandsdaten (Fehlerindizien) in einem akuten,
gravierenden Störfall mit maximaler zeitlicher Optimierung.
Mit den gesicherten, gegebenenfalls aufbereiteten Rechnerzu
standsdaten wird somit die aktuelle Situation zum Zeitpunkt
des Störfalls angezeigt, so daß der Fehler schnell analysiert
und lokalisiert werden kann.
Die Erfindung wird nachstehend anhand eines Ausführungsbei
spiels unter Bezugnahme auf die Zeichnungen näher beschrie
ben. Hierbei zeigen:
Fig. 1 in Form einer Tabelle zu sichernde Rechnerzustandsda
ten,
Fig. 2 ein Flußbild der Umspeicherfunktion bei einem Stör
fall der Haupt-Plattform,
Fig. 3 Schnittstellen und Funktionseinheiten für die Spei
cherung von Rechnerzustandsdaten bei der Haupt-Platt
form, und
Fig. 4 den Ablauf der Datenspeicherung und -umspeicherung
bei einem Störfall einer abhangigen Plattform.
Rechnerzustandsdaten, das heißt als Fehler-Indizien bei Stör
fällen in ausfallsicheren Systemen verwendbare Daten, werden
bei dem erfindungsgemäßen Verfahren fortlaufend in einem
nicht gezeigten Hauptspeicher der Rechnereinheit (Prozessor
einheit) gespeichert. Bei solchen Rechnereinheiten kann es
sich zum Beispiel um die Haupt-Plattform (ultimative Haupt
prozessor-Steuerung MP-SA) und/oder um abhängige Plattformen
(abhängige Hauptprozessoren MP-D) handeln, die insbesondere
in elektronischen Vermittlungssystemen für Telekommunikati
ons-Vermittlung zum Einsatz kommen. Die Erfindung kann aber
auch bei anderen Systemen angewendet werden und erlaubt auch
bei solchen anderen Systemen ein sofortiges Wieder-Hochfahren
einer Rechnereinheit nach einem Absturz oder einem nur durch
Wieder-Anlauf des Systems behebbaren Fehler, ohne daß die
fortlaufend fortgeschriebenen, den Rechnerzustand bis zum Ab
sturz protokollierenden Zustandsdaten verloren gehen. In der
anliegenden Fig. 1 sind in Form einer Tabelle die fortlaufend
registrierten und bei einem Wieder-Hochfahren des Rechners
vor dem Laden des Betriebssystem ausgelagerten Rechnerzu
standsdaten (Fehlerindizien, siehe linke Spalte), einschließ
lich ihrer ungefähren Größe (zweite Spalte), ihrem Ort;
Haupt-Plattform MP-SA oder abhängige Plattform MP-D (mittlere
Spalte), der Anlaufstufe, während der die Daten im Hauptspei
cher überschrieben werden (vierte Spalte) und einer kurzen
Erläuterung ihrer Bedeutung (fünfte Spalte) dargestellt. In
abgewandelter Ausführungsform können jedoch auch zusätzliche
Daten, oder aber nicht alle in Tabelle 1 angegebenen Daten,
erfaßt und bei einem Störfall umgespeichert werden. Da die
Tabelle 1 aus sich selbst heraus verständlich ist, erübrigen
sich weitere diesbezügliche Erläuterungen.
Die erfindungsgemäße Umspeicherfunktion, bei der die Rechner
zustandsdaten von dem Hauptspeicher auf einen externen Daten
träger umgespeichert werden, wird jedesmal dann ausgeführt,
wenn eine Anlaufstufe mit teilweiser oder vollständiger For
matierung des Hauptspeichers durchgeführt werden muß. Wenn
unterschiedliche Anlaufstufen vorhanden sind, bei denen min
destens eine auf höherer Stufe liegt und keine Neuformatie
rung des Hauptspeichers mit Laden des Betriebssystems erfor
dert, wird erfindungsgemäß unterschieden, ob die durchzufüh
rende Anlaufstufe mit einem (selektiven oder vollständigen)
Neuformatieren des Hauptspeichers verknüpft ist. Die Umspei
cherfunktion wird lediglich dann ausgeführt, wenn erfaßt
wird, daß eine Anlaufstufe mit mindestens teilweiser Neufor
matierung des Hauptspeichers durchzuführen ist. Hierzu wird
die Umspeicherfunktion vorzugsweise in einer Basisprogramme
bene abgelegt, die bei einem Wieder-Hochfahren mit erneutem
Laden des Betriebssystems abgearbeitet wird, und zwar noch
vor dem Laden des Betriebssystems.
Die erfindungsgemäße, die Umspeicherung der relevanten Rech
nerzustandsinformationen aus dem Hauptspeicher auf den exter
nen Datenträger bewirkende Umspeicherfunktion benötigt Infor
mationen über die Adresse und die Länge der zu sichernden Da
ten in dem Hauptspeicher. Sofern unterschiedliche, auf unter
schiedlichen Interrupt-Leveln arbeitende Programm, zum Bei
spiel Supervisor-Software und Benutzer-Software vorhanden
sind, kann die Umspeicherfunktion zwei Interface-Prozeduren
bereitstellen, die bei einem Wieder-Hochfahren entsprechend
aufgerufen werden. Sofern die durch die Benutzer-Software be
reitgestellten Adressen aufgrund der internen Systemgestal
tung lediglich in logischem Format vorliegen sollten, wandelt
die Umspeicherfunktion diese Daten in den entsprechenden phy
sikalischen Bereich um, indem eine entsprechende Umwandlungs
progammroutine, zum Beispiel eine Betriebssystem-Schnittstel
le, aufgerufen wird.
In Fig. 2 ist der Ablauf der Datenumspeicherung bei einer
Haupt-Plattform MP-SA eines elektronischen Wählvermittlungs
systems dargestellt. Vor einem Störfall-bedingten, erneuten
Anlauf des Prozessors (Schritt 1) werden von der Benutzer-
Software und den sonstigen Komponenten Rechnerzustandsdaten
kontinuierlich in den Hauptspeicher der Haupt-Plattform ein
geschrieben und eine entsprechende Angabe über Speicheradres
se und Bereichslänge fortlaufend aktualisiert. Bei der zu ei
ner Neu-Formatierung des Hauptspeichers führenden Anlaufstufe
(Schritt 1) wird dann bei einem Schritt 2 vor dem Laden des
Betriebssystems ein Zugriff zu den Rechnerzustandsdaten des
Hauptspeichers durchgeführt und diese bei einem Schritt 3 auf
der Festplatte gespeichert. Anschließend wird bei einem
Schritt 4 aufgrund des Hochfahrens des Rechners erneut der
normale Arbeitsbetrieb erreicht.
Damit die gesicherten, den Rechnerzustand bei Auftreten des
gravierenden Fehlers angebenden Rechnerzustandsdaten für eine
Fehleranalyse und ggf. -behebung ausgewertet werden können,
ist vorzugsweise eine Datenumwandlungsprozedur vorgesehen,
die zum Beispiel durch eine Q3-Anforderung eines Basistermi
nals BCT (basic craft terminal) aufgerufen wird (Schritt 5).
Durch diese Anforderung wird der Prozessor dazu veranlaßt,
die gesicherten Rechnerzustandsdaten von der Festplatte zu
lesen, die Daten zu identifizieren und die entsprechende Um
wandlungsroutine für jede Datenart aufzurufen (Schritte 7,
8). Die entsprechend aufbereiteten, formatierten Daten werden
dann erneut auf der Platte über die Q3-Schnittstelle in eine
separate Ausgabedatei eingeschrieben (Schritte 9, 10). Diese
Datei kann über eine Q3-Anforderung für eine Datenanalyse
oder dergleichen ausgelesen werden. Die Ausgabedatei läßt
sich dann zum Betriebssystem, beispielsweise zum Telekommuni
kationsmanagement-Betriebssystem, übertragen.
Bei der vorliegenden Ausführungsform ist der vorstehend er
läuterte Datenumwandlungs-Steuerprozeß lediglich auf der
Haupt-Plattform vorgesehen, so daß zur Aufbereitung von gesi
cherten Rechnerzustandsdaten, die von anderen Rechnereinhei
ten, z. B. von abhängigen Plattformen, stammen, auf die Haupt-
Plattform zugegriffen wird.
Der Datenumwandlungssteuerprozeß kann durch den jeweiligen
Benutzer selbst vorgenommen und aufgerufen werden, insbeson
dere über die Q3-Anforderung.
In Fig. 3 sind die Schnittstellen und Funktionseinheiten für
die Rechnerzustandsdaten-Aufzeichnung und Umspeicherung in
Form eines Schaubilds dargestellt. Während des normalen Rech
nerbetriebs werden bei der Programmabarbeitung, zum Beispiel
durch die Benutzer-Software 11, logische Adressen der später
gegebenenfalls zu sichernden Daten zur Verfügung gestellt,
die durch die einen Bestandteil des erfindungsgemäßen Verfah
rens darstellende Umwandlungsfunktion 12 in physikalische
Adressen umgewandelt werden. Sowohl die logischen als auch
die physikalischen Informationen (Adressen) werden dann in
der Tabelle im Hauptspeicher gespeichert.
Bei einem durch einen gravierenden Störfall bedingten Wieder
anlauf des Rechners werden in einer Boot-Stufe, zum Beispiel
der Boot-Stufe 3 (Block 15) die Daten aus dem Hauptspeicher
ausgelesen und auf die Festplatte 17 mit Hilfe eines Systems
16 für Off-Line-Filing gespeichert.
Nach erfolgreichem Hochlauf kann wieder On-Line über eine Q3-An
forderung (Block 18) ein Abruf der auf der Festplatte 17
gespeicherten Rechnerzustandsdaten und eine Formatierung der
selben unter Aufruf von Umwandlungsroutinen (Blöcke 19, 20)
durchgeführt werden. Die umgewandelten, formatierten Daten
können über ein On-Line-Filing-System 21 wieder auf die Fest
platte 17 zurückgeschrieben werden oder auch über eine Über
tragungs-Routine 22 auf eine Festplatte 23 gespeichert wer
den. Bei dem erfindungsgemäßen Verfahren werden alle relevan
ten Informationen, zum Beispiel die physikalischen und logi
schen Adressen, in einer internen Tabelle in dem Hauptspei
cher gespeichert, wobei die Tabelle an einer bestimmten phy
sikalischen Adresse angeordnet ist. Hierdurch wird sicherge
stellt, daß die Tabelle, das heißt die Informationen, beim
Wieder-Hochfahren des Rechners (zum Beispiel bei der Boot-Stufe
3 bei der ultimativen Haupt-Plattform bzw. bei der
Boot-Stufe 2 bei der abhängigen Plattform), gelesen werden
können. Bei einer solchen Anlaufstufe, die ein mindestens
teilweises Formatieren des Hauptspeichers beinhaltet, werden
die Daten über das Off-Line-Filing-System 16 in eine separate
Datei auf der Festplatte 17 umgespeichert, wenn die Haupt-
Plattform nach einem Störfall wieder hochgefahren wird.
In Fig. 4 ist der Ablauf der Umspeicherfunktion bei einer ab
hängigen Plattform MP-D dargestellt. Wenn bei einer abhängi
gen Plattform 24 ein Störfall auftritt, der ein Wieder-Hoch
fahren mit erneutem Laden des Betriebssystems erfordert, wird
dies durch die Haupt-Plattform 25 aufgrund der von der abhän
gigen Plattform 24 ausbleibenden Signale Resynch mittels ei
ner Routine HWFP 26 (Hardware-Fehlerverarbeitung) erkannt.
Wenn danach durch die Haupt-Plattform 25 die Entscheidung zur
Reaktivierung, das heißt zum Wieder-Hochfahren der abhängigen
Plattform 24 getroffen wird, wird ein Konfigurations-Verwal
tungsprogramm CONF in der Haupt-Plattform gestartet, das zum
Wieder-Hochfahren der abhängigen Plattform 24 dient. Das Pro
gramm CONF 27 bewirkt dann die Aussendung eines Triggersi
gnals 28 an die abhängige Plattform 24, um hierdurch eine Da
tenübertragung 29 aus dem Hauptspeicher der abhängigen Platt
form 24 zu der Haupt-Plattform 25 einzuleiten. Das Programm
CONF ruft somit die Umspeicherfunktion zur Umspeicherung der
Rechnerzustandsdaten auf, die bei dem Datenübertragungs
schritt 29 aus dem Hauptspeicher der Plattform 24 zur Haupt-
Plattform 25 übertragen werden. Diese Datenübertragung ist
aufgrund des durch den Adressenpointer und die Bereichslänge
klar definierten zusammenhängenden Speicherbereichs des
Hauptspeichers der Plattform 24 rasch abgeschlossen, so daß
die Aktivierung der abhängigen Plattform 24 nicht nennenswert
verzögert wird.
Hierbei wird durch das Triggersignal 28 die erfindungsgemäße
Umspeicherfunktion in der abhängigen Plattform 24 aufgerufen,
wobei in diesem Fall die Haupt-Plattform 25 als externer Da
tenträger dient. Anschließend werden diese zunächst im Haupt
speicher der Haupt-Plattform 25 gespeicherten, den Hardware-
und Softwarezustand der abhängigen Plattform 24 vor und beim
Störfall anzeigenden Rechnerzustandsdaten bei einem Übertra
gungsschritt 30 mittels eines On-Line-Filing-Systems 31 auf
einer Festplatte gesichert. Durch das Programm CONF 27 wird
die erfindungsgemäße Umspeicherfunktion bei allen automati
schen Aktivierungen der abhängigen Plattformen 24 eingelei
tet. Falls jedoch in einer abhängigen Plattform 24 ein Reset
durch Spannungsunterbrechung bei der abhängigen Plattform 24
ausgelöst wurde, besteht die Gefahr, daß der Speicherinhalt
der abhängigen Plattform gestört ist. In diesem Fall werden
daher vorzugsweise keine Daten von einer solchen abhängigen
Plattform aufgenommen.
Nach dem Abschluß der Datenumspeicherung kann der Hauptspei
cher der betreffenden Rechnereinheit selektiv oder vollstän
dig formatiert werden, ohne daß dies negative Einflüsse auf
die Fehleranalyse und -behebung ausübt.
Falls gleichzeitig Daten von mehr als einer abhängigen Platt
form 24 gesichert werden sollen, werden zunächst die Rechner
zustandsdaten lediglich von derjenigen abhängigen Plattform
gesichert, deren Umspeicherfunktion zuerst aufgerufen wurde.
Alle anderen Anforderungen hinsichtlich einer Umspeicherung
werden zurückgewiesen, bis der ablaufende Umspeichervorgang
abgeschlossen ist. Erst nach Abschluß des ersten Umspeicher
vorgangs werden dann aufeinanderfolgend die Rechnerzustands
daten von weiteren, hochzufahrenden Plattformen gesichert.
Vorzugsweise kann zur Erleichterung der automatischen Verar
beitung und der Übertragung der zu sichernden Daten in dem
Betriebssystem vorgesehen sein, daß die Dateien, in die die
gesicherten Daten eingeschrieben werden, mit entsprechenden,
systemangepaßten Dateinamen versehen werden. Hierbei kann
vorgesehen sein, daß für die Haupt-Plattform maximal vier Da
teien für die gesicherten Rechnerzustandsdaten gebildet wer
den, während maximal acht Dateien für die abhängenden Platt
formen vorgesehen sind. Bei dem erfindungsgemäßen Verfahren
können somit die Rechnerzustandsdaten (Symptome oder Fehle
rindizien) nicht nur in einem beim Wiederhochlaufen nicht um
formatierten Datenträger gespeichert, sondern auch in ein
Format umgewandelt werden, das für eine Benutzer-Eingabe/Aus
gabe (Benutzer-I/O) geeignet ist.
Weiterhin können die Rechnerzustandsdaten auch Informationen
über alle wichtigen peripheren Geräte, zum Beispiel über de
ren Betriebszustand, enthalten. Weiterhin werden bei Erken
nung von Software-Fehlern vorzugsweise die folgenden Rechner
zustandsdaten gespeichert: Modulname, Softwarefehler-Nummer,
Anlaufstufe, Interrupt-Adresse, Prozessor-Name und letzter
aktiver Prozeß.
Die Rechnerzustandsdaten beinhalten auch den Sicherungsbe
reich für die Softwarefehlerbehandlung SWET. Dieser Bereich
enthält alle Fehlermeldungen, die bei Softwarefehler-Meldun
gen gemeldet wurden, genauer gesagt, alle mitgeteilten, aber
noch nicht in einer Fehlermeldungs-Datei gesicherten Softwa
refehler-Informationen.
Ferner können Systemüberwachungs-Daten bei Reaizeitfehlern
gespeichert werden. Darüber hinaus können Fehleraufzeichnun
gen (Symptomdatenaufzeichnungen) in den Rechnerzustandsdaten
enthalten sein, soweit diese noch nicht in einer eigenen Si
cherheitsmaßnahmen-Datei gespeichert wurden, die auch beim
Wieder-Hochfahren des Rechners unbeschädigt bleibt. Weiterhin
können die Rechnerzustandsdaten relevante Information über
den aktuellen und den letzten Hochlauf und/oder Fehlerindizi
en bei den letzten Hochlaufvorgängen enthalten. Ferner kann
ein Hardware-Kommunikationsbereich ebenfalls in den Rechner
zustandsdaten enthalten sein, so daß dieser durch die erfin
dungsgemäße Umspeicherfunktion gleichfalls gesichert wird.
Zu den Rechnerzustandsdaten, die in Fig. 1 gezeigt sind, kön
nen auch alle Fehlermeldungen gerechnet werden, die ihrer
seits nicht selbst zu einem Anlauf des Rechners führen. Diese
Fehlermeldungen enthalten auch Aussagen über die Zustände der
Peripherie-Geräte. Hierbei können zwei Tabellen vorgesehen
sein, wobei in einer Tabelle lediglich die Fehlermeldungen
bei dem aktuellen Störfall enthalten sind. Diese Informatio
nen werden lediglich dann gesichert, wenn ein vollständiger
Ausfall der Peripherie zu verzeichnen ist. In der weiteren
Tabelle werden die Fehlermeldungen gespeichert, die bei frü
heren Störfällen aufgetreten waren.
Die Rechnerzustandsdaten können zudem auch zentrale Konfigu
rationsdaten über die einzelnen Zustände der zentralen Ein
heiten enthalten.
Falls es bei dem Hochfahren des Rechners aus irgendwelchen
Gründen nicht möglich sein sollte, die Rechnerzustandsdaten
auf die Festplatte umzuspeichern, kann statt dessen eine ent
sprechende Information in dem Kommunikationsbereich gespei
chert und am Abschluß des Hochlaufs ausgegeben werden.
Die Darstellung der Fehlermeldungen auf einem Monitor und das
Einschreiben auf die Festplatte können unter Verwendung des
BIOS-Systems durchgeführt werden. Durch die erfindungsgemäße
Umspeicherung lassen sich hierbei auch Verzögerungen vermei
den, die bei Einsatz einer Prozeß-Kommunikation auftreten
würden.
1
bis
10
Arbeitsschritte
11
Benutzer-Software
12
Umwandlung
13
Betriebssystem
14
Steuersoftware
15
Datenholung
16
Off-line-Filing-System
17
Festplatte
18
Q3-Anforderung
19
Formatierung
20
Benutzer-Software
21
On-line-Filing-System
22
Übertragungs-Routine
23
Festplatte
24
Plattform
25
Haupt-Plattform
26
HWFP-Routine
27
CONF-Programm
28
Triggersignal
29
Daten-Übertragung
30
Übertragungsschritt
31
On-line-File-System
Claims (6)
1. Verfahren zur Speicherung von den Zustand eines Rechners
charakterisierenden Rechnerzustandsdaten bei einem Störfall,
der ein anschließendes Wieder-Hochfahren des Rechners erfor
dert,
bei dem die Rechnerzustandsdaten fortlaufend in dem Haupt speicher des Rechners gespeichert werden, und
die Rechnerzustandsdaten bei dem Wieder-Hochfahren des Rech ners vor dem Formatieren des Hauptspeichers aus diesem ausge lesen und auf einen Datenträger umgespeichert werden.
bei dem die Rechnerzustandsdaten fortlaufend in dem Haupt speicher des Rechners gespeichert werden, und
die Rechnerzustandsdaten bei dem Wieder-Hochfahren des Rech ners vor dem Formatieren des Hauptspeichers aus diesem ausge lesen und auf einen Datenträger umgespeichert werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeich
net, daß die Umspeicherfunktion beim Durchlaufen der Urlade
funktion aufgerufen wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekenn
zeichnet, daß für den Zugriff zu den Rechnerzustandsdaten
die Anfangsadresse und der Umfang des diese Rechnerzustands
daten enthaltenden Bereichs des Hauptspeichers angegeben wer
den.
4. Verfahren nach einem der vorhergehenden Ansprüche, da
durch gekennzeichnet, daß die auf den Datenträger
umgespeicherten, in binärer Form vorliegenden Rechnerzu
standsdaten aufbereitet und in eine lesbare, symbolische Form
gebracht werden.
5. Verfahren nach einem der vorhergehenden Ansprüche, da
durch gekennzeichnet, daß beim Wieder-Hochfahren des
Rechners nach einem Störfall überprüft wird, ob die Anlauf
stufe ein Neu-Formatieren des Hauptspeichers beinhaltet, und
die Umspeicherfunktion bei einem Hochfahren ohne Neu-Forma
tierung des Hauptspeichers nicht aufgerufen wird.
6. Verfahren nach einem der vorhergehenden Ansprüche, da
durch gekennzeichnet, daß die Rechnerzustandsdaten
Rücksetzanforderungen, die von Hardware-Komponenten oder
Software-Komponenten erzeugt wurden, und/oder Informationen
über Anforderungen einer Software-Fehlerverarbeitung und/oder
die geforderte Anlaufstufe und/oder Diagnoseergebnisse bezüg
lich der Rechnereinheit und der Festplatte enthalten.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP97112883 | 1997-07-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19827432A1 true DE19827432A1 (de) | 1999-01-28 |
DE19827432C2 DE19827432C2 (de) | 2001-07-26 |
Family
ID=8227125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19827432A Expired - Fee Related DE19827432C2 (de) | 1997-07-25 | 1998-06-19 | Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert |
Country Status (2)
Country | Link |
---|---|
US (1) | US6279120B1 (de) |
DE (1) | DE19827432C2 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004001819A1 (de) * | 2004-01-07 | 2005-08-04 | Siemens Ag | Redundante Rechnerkonfiguration |
DE102004047363A1 (de) * | 2004-09-29 | 2006-03-30 | Siemens Ag | Prozessor bzw. Verfahren zum Betreiben eines Prozessors und/oder Betriebssystems im Fall einer Störung |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0902368A1 (de) * | 1997-07-23 | 1999-03-17 | Siemens Aktiengesellschaft | Verfahren zum Wiederanlauf eines Rechnersystems |
EP1085396A1 (de) * | 1999-09-17 | 2001-03-21 | Hewlett-Packard Company | Betrieb von gesicherten Zustand in einer Computerplattform |
US7111307B1 (en) | 1999-11-23 | 2006-09-19 | Microsoft Corporation | Method and system for monitoring and verifying software drivers using system resources including memory allocation and access |
US6810493B1 (en) * | 2000-03-20 | 2004-10-26 | Palm Source, Inc. | Graceful recovery from and avoidance of crashes due to notification of third party applications |
US6728907B1 (en) * | 2000-04-14 | 2004-04-27 | Microsoft Corporation | System and method for self-diagnosing system crashes |
US20020083362A1 (en) * | 2000-12-22 | 2002-06-27 | Objectsoft Corp. | System and method for providing unattended personality acquisition, self-recovery and remote maintenance to internet-based end-user devices |
US7062677B1 (en) * | 2001-08-09 | 2006-06-13 | Cisco Tech Inc | Method for capturing core dump of a service module |
US20040025081A1 (en) * | 2002-07-31 | 2004-02-05 | Jorge Gonzalez | System and method for collecting code coverage information before file system is available |
WO2004038643A2 (en) * | 2002-10-25 | 2004-05-06 | Mcpheely Bernard M | Digital diagnosti video system for manufacturing and industrial process |
US7308609B2 (en) * | 2004-04-08 | 2007-12-11 | International Business Machines Corporation | Method, data processing system, and computer program product for collecting first failure data capture information |
US7788537B1 (en) * | 2006-01-31 | 2010-08-31 | Emc Corporation | Techniques for collecting critical information from a memory dump |
US7533314B2 (en) * | 2006-08-10 | 2009-05-12 | Microsoft Corporation | Unit test extender |
US8539200B2 (en) * | 2008-04-23 | 2013-09-17 | Intel Corporation | OS-mediated launch of OS-independent application |
US8631186B2 (en) | 2008-09-30 | 2014-01-14 | Intel Corporation | Hardware and file system agnostic mechanism for achieving capsule support |
CN109684133A (zh) * | 2018-12-20 | 2019-04-26 | 林琳 | 一种计算机死机状态自动重启方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1242809A (en) * | 1985-12-20 | 1988-10-04 | Mitel Corporation | Data storage system |
US4740969A (en) * | 1986-06-27 | 1988-04-26 | Hewlett-Packard Company | Method and apparatus for recovering from hardware faults |
JP2696511B2 (ja) | 1987-07-09 | 1998-01-14 | 沖電気工業株式会社 | パワーダウンモードからの復帰方式 |
US5021963A (en) | 1988-12-30 | 1991-06-04 | Pitney Bowes Inc. | EPM having an improvement in accounting update security |
US5151987A (en) * | 1990-10-23 | 1992-09-29 | International Business Machines Corporation | Recovery objects in an object oriented computing environment |
JPH056295A (ja) * | 1991-06-27 | 1993-01-14 | Nec Eng Ltd | 情報処理装置のダンプ方式 |
JP3481737B2 (ja) * | 1995-08-07 | 2003-12-22 | 富士通株式会社 | ダンプ採取装置およびダンプ採取方法 |
JP3493368B2 (ja) * | 1995-08-11 | 2004-02-03 | 富士通株式会社 | 通信システム |
-
1998
- 1998-06-19 DE DE19827432A patent/DE19827432C2/de not_active Expired - Fee Related
- 1998-07-27 US US09/123,219 patent/US6279120B1/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004001819A1 (de) * | 2004-01-07 | 2005-08-04 | Siemens Ag | Redundante Rechnerkonfiguration |
DE102004047363A1 (de) * | 2004-09-29 | 2006-03-30 | Siemens Ag | Prozessor bzw. Verfahren zum Betreiben eines Prozessors und/oder Betriebssystems im Fall einer Störung |
Also Published As
Publication number | Publication date |
---|---|
DE19827432C2 (de) | 2001-07-26 |
US6279120B1 (en) | 2001-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19827432C2 (de) | Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert | |
DE102005022192B4 (de) | Datensicherungs-Laufwerk mit auswechselbaren Speichermedien zum Sichern von Daten eines Hostcomputers | |
DE2428348C2 (de) | Verfahren zur Weiterbenutzung eines fehlerhaften Datenspeichers und Einrichtung zur Durchführung dieses Verfahrens | |
DE4040927C2 (de) | Verfahren und Vorrichtung zur Fehlerspeicherung in einer Steuereinrichtung eines Kraftfahrzeugs | |
DE19740525C1 (de) | Verfahren zur Abspeicherung und Wiedergewinnung von Daten in einem Steuersystem, insbesondere in einem Kraftfahrzeug | |
DE60025043T2 (de) | Vorrichtung und verfahren mit verwendung von anwendungabhängigkeitsinformation für eine sicherungskopieherstellung in einem computersystem | |
DE10211606A1 (de) | Datenverarbeitungseinrichtung | |
CH629901A5 (de) | Verfahren zum steuern einer textverarbeitungseinrichtung beim speichern und lesen von text. | |
DE2458285C2 (de) | Periphere Steuerung | |
DE4305522A1 (de) | Einrichtung zur automatischen Erzeugung einer Wissensbasis für ein Diagnose-Expertensystem | |
DE2450468C2 (de) | Fehlerkorrekturanordnung für einen Speicher | |
EP1924916A2 (de) | Speicheranordnung und betriebsverfahren dafür | |
EP0572019B1 (de) | Verfahren zum Betreiben einer Datenverarbeitungsanlage | |
EP2539899B1 (de) | Verfahren zur überprüfung der funktionsfähigkeit eines speicherelements | |
EP0433350A1 (de) | Betriebsprogramm für eine datenverarbeitungsanlage | |
DE102019132679A1 (de) | Überwachungsverfahren für cpu-nutzungsmenge im betrieb von fahrzeug-ecu und überwachungseinheit | |
DE1966991C3 (de) | Ausfallgesicherte Datenverarbeitungsanlage | |
DE2823457C2 (de) | Schaltungsanordnung zur Fehlerüberwachung eines Speichers einer digitalen Rechenanlage | |
EP1750283B1 (de) | Überprüfung eines Adressdecoders | |
DE3535215A1 (de) | Verfahren und schaltungsanordnung zum lesen von daten aus dem speicher einer datenverarbeitungsanlage | |
EP0151810A2 (de) | Verfahren und Schaltungsanordnung zum Prüfen eines Programms in Datenverarbeitungsanlagen | |
DE19636384C2 (de) | Vorrichtung zur Fehlerdiagnose sowie Verfahren zur Fehlerdiagnose | |
WO2000017754A1 (de) | Verfahren zur erfassung des datenzustandes | |
DE102019208129B4 (de) | Elektronische Steuereinheit | |
DE3927703A1 (de) | Computersystem vom gemeinschaftsdaten-typ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |