DE19827432A1 - Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert - Google Patents

Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert

Info

Publication number
DE19827432A1
DE19827432A1 DE19827432A DE19827432A DE19827432A1 DE 19827432 A1 DE19827432 A1 DE 19827432A1 DE 19827432 A DE19827432 A DE 19827432A DE 19827432 A DE19827432 A DE 19827432A DE 19827432 A1 DE19827432 A1 DE 19827432A1
Authority
DE
Germany
Prior art keywords
computer
data
main memory
status data
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19827432A
Other languages
English (en)
Other versions
DE19827432C2 (de
Inventor
Horst Ripken
Franz Schroeder
Gulbicki Zbigniew
Petro Istavrinos
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of DE19827432A1 publication Critical patent/DE19827432A1/de
Application granted granted Critical
Publication of DE19827432C2 publication Critical patent/DE19827432C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering

Description

Die Erfindung betrifft ein Verfahren zur Speicherung von den Zustand eines Rechners bei einem gravierenden Störfall be­ schreibenden Daten, die anschließend zur Fehleranalyse und gegebenenfalls Behebung eingesetzt werden können. Solche gra­ vierenden Störfälle können zum Beispiel durch Software- oder Hardwarefehler hervorgerufen werden und verhindern dann einen weiteren Normalbetrieb bzw. können gegebenenfalls auch zum gesamten Rechnerabsturz führen. Im allgemeinen sind hierbei keine Zustandsdaten vorhanden, die den Rechnerzustand unmit­ telbar vor und während des Störfalls protokollieren würden. Daher fehlt im allgemeinen die Möglichkeit, die Absturzursa­ che und auch den Fehler zu lokalisieren.
Hinzu tritt, daß manche Rechnereinheiten im Echtzeitbetrieb ständig verfügbar sein müssen, zum Beispiel bei digitalen Fernsprechvermittlungssystemen. Ein solcher Rechner wird nach einem Absturz normalerweise automatisch so fort wieder hochge­ fahren, wobei teilweise auch der Hauptspeicher neu formatiert wird. Ein weiteres Problem besteht auch darin, daß aufgrund der sofortigen Wiederinbetriebnahme des Rechners keine Mög­ lichkeit zur Fehlersuche verbleibt. Es ist daher sehr mühsam, die Absturzursache, das heißt Hardware- oder Softwarefehler, zielstrebig zu analysieren und zu beheben.
Zur Bereitstellung von Rechner-Zustandsinformationen unmit­ telbar vor einem gravierenden Störfall könnte überlegt wer­ den, während des Normalbetriebs ständig Daten über den Rech­ nerzustand zu protokollieren, um hieraus nach einem gravie­ renden Störfall die Fehlerursache analysieren zu können. Je­ doch können solche Daten aus Dynamikgründen nicht sofort ex­ tern, zum Beispiel auf einer Festplatte, gesichert werden, da ansonsten die Leistungsperformance des Rechners zu stark ein­ geschränkt würde. Solche Daten müßten daher periodisch oder bei Erreichen eines bestimmten Volumens, das heißt in größe­ ren Zeitabständen gesichert werden. Bei Auftreten eines gra­ vierenden Störfalls, der zu einem Wiederanlaufen des Rechners führt, wird dann aber häufig auch der Hauptspeicher neu for­ matiert, so daß dann die dort noch enthaltenen Zustandsinfor­ mationen überschrieben werden. Es fehlen dann aber die Zu­ standsinformationen für den kritischsten Zeitbereich, nämlich für den Zeitbereich zwischen dem letzten Sicherungszeitpunkt und dem Zeitpunkt des Störfalls, so daß die Fehleranalyse nur auf unvollständigem Datenmaterial beruhen kann.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur effektiven Speicherung von eine gute Fehleranalyse ermögli­ chenden Rechnerzustandsinformationen bei einem Störfall be­ reitzustellen.
Diese Aufgabe wird mit den im Patentanspruch 1 genannten Maß­ nahmen gelöst. Vorteilhafte Ausgestaltungen der Erfindung sind in den Unteransprüchen angegeben.
Bei dem erfindungsgemäßen Verfahren werden somit ständig In­ formationen über den Zustand des Rechners (Rechnerzu­ standsdaten) im Hauptspeicher gesammelt. Diese Informationen repräsentieren relevante Informationen aus jeweils gerade in Verarbeitung befindlichen oder laufenden Programmeinheiten und/oder Informationen über den Zustand von Hardwareeinhei­ ten, insbesondere von Fehlersignale generierenden Hardware­ komponenten. Damit steht im Hauptspeicher stets ein Informa­ tionsbereich zur Verfügung, der bei einem leichteren, kein Wieder-Hochfahren des Rechners erfordernden Störfall unmit­ telbar oder zu einem geeigneten Zeitpunkt ausgewertet werden kann, um hierdurch Fehler in den Software- und/oder Hardware­ komponenten zu analysieren und auszumerzen.
Wenn jedoch ein gravierender Störfall auftritt, der ein An­ laufen des Rechners mit vollständiger oder teilweiser Forma­ tierung des Hauptspeichers erfordert, würden diese Rechnerzu­ standsdaten im Hauptspeicher überschrieben werden, so daß die Informationen verloren gehen und keine Fehleranalyse mehr er­ möglichen. Zur Lösung dieses Problems ist bei dem erfindungs­ gemäßen Verfahren ein zusätzlicher Programmabschnitt vorgese­ hen, der eine Umspeicherung der Rechnerzustandsdaten von dem Hauptspeicher auf einen anderen Datenträger, zum Beispiel auf die Festplatte, bewirkt. Diese Umspeicherung wird in der An­ fangsphase des Hochfahrens noch vor dem Formatieren des Hauptspeichers und insbesondere noch vor dem Laden des Be­ triebssystems ausgeführt, das heißt in einem Zustand, bei dem der Hauptspeicherinhalt und damit die Rechnerzustandsdaten noch unverändert ist. Diese Rechnerzustandsdaten stehen dem­ zufolge auch nach dem Hochfahren des Rechners für eine sofor­ tige oder auch spätere Fehleranalyse zur Verfügung, die in­ tern oder extern durchgeführt werden kann. Da die Rechnerzu­ standsdaten bis unmittelbar zu dem Auftreten des Störfalls fortgeschrieben worden sind, beinhalten sie auch die aktuell­ sten Informationen, die eine bestmögliche Fehleranalyse zu­ lassen.
Bei einer Ausführungsform der Erfindung werden die Speicher­ bereiche des Hauptspeichers, in denen die Rechnerzustandsda­ ten gespeichert sind und die somit eine Datensammlungs-Tabel­ le bilden, einer zentralen Umspeicherfunktion insbesondere durch Übergabe der Hauptspeicheradresse und der Länge des Speicherbereichs mitgeteilt. Die Umspeicherfunktion ist hier­ bei derart ausgelegt, daß sie auch ohne Betriebssystemunter­ stützung arbeiten kann, da das Betriebssystem möglicherweise ebenfalls fehlerhaft sein kann bzw. eine verfälschte Daten­ haltung bewirkt. Die Umspeicherfunktion ist daher vorzugswei­ se softwaretechnisch als autonomer Abschnitt in den untersten Software-Schichten unterhalb des Betriebssystems realisiert. Die Umspeicherfunktion ist vorzugsweise in der Boot-Stufe an­ gesiedelt, das heißt liegt in der "Urlade-Software". Bei Auf­ treten einer schwerwiegenden Störung wird als Reaktion die Urladephase durchlaufen, so daß die Umspeicherfunktion ange­ stoßen wird und sich die Rechnerzustandsdaten aus dem ihr mitgeteilten Hauptspeicherbereich ausliest und über eine ele­ mentare Ein-/Ausgabe-Schnittstelle auf einen externen Daten­ träger ausgibt. Dieser Vorgang kann zeitlich optimal inner­ halb von wenigen Sekunden ablaufen, da die entsprechenden Da­ tenbereiche kompakt sehr rasch transferiert werden können und der Transport unmittelbar, das heißt ohne weiteren System- Overhead, abläuft.
Theoretisch könnte auch überlegt werden, die die Rechnerzu­ standsdaten enthaltenden Hauptspeicherbereiche bei der Spei­ cher-Neuformatierung auszuklammern, um ein Überschreiben die­ ser Daten zu verhindern. Jedoch könnte sich hierbei das mit der vorliegenden Erfindung vermiedene Problem ergeben, daß bei eventuellen, durch Systemfehler bedingten Verfälschungen dieser Daten der Rechner nach dem Hochlaufen aufgrund dieser verfälschten Hauptspeicher-Dateninhalte erneut fehlerhaft ar­ beitet und eventuell wieder abstürzt.
Aufgrund der erfindungsgemäßen Vorgehensweise können auch die Rechnerzustandsdaten-Speicherbereiche des Hauptspeichers nach der Umspeicherung neu formatiert werden, so daß in diesen Speicherbereichen eventuell vorhandene Datenverfälschungen neutralisiert werden.
Darüber hinaus ist bei schwereren Störfällen eine Neuforma­ tierung des gesamten Hauptspeichers unumgänglich, wobei auch solche für die Rechnerzustandsdaten reservierten Speicherbe­ reiche formatiert werden müssen.
Ferner läßt sich bei der erfindungsgemäßen Vorgehensweise der zu sicherende Speicherbereich durch fest programmierte Daten­ schnitt stellen, das heißt durch Pointer auf Datenstrukturen, festlegen, so daß auch Erweiterungen des benötigten Speicher­ platzes stets unter zentraler Kontrolle durchgeführt werden.
Durch die strikte Kontrolle des Rechnerzustandsdaten-Spei­ cherbereichs ist es darüber hinaus auch präzise möglich, die durch Umspeicherung gesicherten Rechnerzustandsdaten in les­ bare Form aufzubereiten. Die gesicherten Informationen sind nämlich im allgemeinen binär und damit nicht lesbar. In vor­ teilhafter Ausgestaltung werden diese Rechnerzustandsdaten daher nach erfolgreichem Hochlauf wieder von dem externen Da­ tenträger, zum Beispiel der Platte, eingelesen und aufberei­ tet und hierdurch in eine lesbare, symbolische Form gebracht. Anhand dieser aufbereiteten Daten läßt sich dann die Fehler­ suche und -analyse durchführen. Die aufbereiteten Daten las­ sen sich ihrerseits auf einem Datenträger, zum Beispiel auf der Festplatte, abspeichern, und stehen in diesem Fall auch für eine eventuelle spätere Fehleranalyse oder eine Fehler­ protokollierung zur Verfügung. Die Datenaufbereitungsfunktion muß jedoch nicht zwingend im Rechner selbst On-Line stattfin­ den, sondern kann auch Off-Line erfolgen.
Bei dem erfindungsgemäßen Verfahren wird somit die Umspei­ cherfunktion auf einer Ebene unterhalb des Betriebssystems bereitgestellt und erlaubt eine effektive Sicherung der rele­ vanten Rechnerzustandsdaten (Fehlerindizien) in einem akuten, gravierenden Störfall mit maximaler zeitlicher Optimierung. Mit den gesicherten, gegebenenfalls aufbereiteten Rechnerzu­ standsdaten wird somit die aktuelle Situation zum Zeitpunkt des Störfalls angezeigt, so daß der Fehler schnell analysiert und lokalisiert werden kann.
Die Erfindung wird nachstehend anhand eines Ausführungsbei­ spiels unter Bezugnahme auf die Zeichnungen näher beschrie­ ben. Hierbei zeigen:
Fig. 1 in Form einer Tabelle zu sichernde Rechnerzustandsda­ ten,
Fig. 2 ein Flußbild der Umspeicherfunktion bei einem Stör­ fall der Haupt-Plattform,
Fig. 3 Schnittstellen und Funktionseinheiten für die Spei­ cherung von Rechnerzustandsdaten bei der Haupt-Platt­ form, und
Fig. 4 den Ablauf der Datenspeicherung und -umspeicherung bei einem Störfall einer abhangigen Plattform.
Rechnerzustandsdaten, das heißt als Fehler-Indizien bei Stör­ fällen in ausfallsicheren Systemen verwendbare Daten, werden bei dem erfindungsgemäßen Verfahren fortlaufend in einem nicht gezeigten Hauptspeicher der Rechnereinheit (Prozessor­ einheit) gespeichert. Bei solchen Rechnereinheiten kann es sich zum Beispiel um die Haupt-Plattform (ultimative Haupt­ prozessor-Steuerung MP-SA) und/oder um abhängige Plattformen (abhängige Hauptprozessoren MP-D) handeln, die insbesondere in elektronischen Vermittlungssystemen für Telekommunikati­ ons-Vermittlung zum Einsatz kommen. Die Erfindung kann aber auch bei anderen Systemen angewendet werden und erlaubt auch bei solchen anderen Systemen ein sofortiges Wieder-Hochfahren einer Rechnereinheit nach einem Absturz oder einem nur durch Wieder-Anlauf des Systems behebbaren Fehler, ohne daß die fortlaufend fortgeschriebenen, den Rechnerzustand bis zum Ab­ sturz protokollierenden Zustandsdaten verloren gehen. In der anliegenden Fig. 1 sind in Form einer Tabelle die fortlaufend registrierten und bei einem Wieder-Hochfahren des Rechners vor dem Laden des Betriebssystem ausgelagerten Rechnerzu­ standsdaten (Fehlerindizien, siehe linke Spalte), einschließ­ lich ihrer ungefähren Größe (zweite Spalte), ihrem Ort; Haupt-Plattform MP-SA oder abhängige Plattform MP-D (mittlere Spalte), der Anlaufstufe, während der die Daten im Hauptspei­ cher überschrieben werden (vierte Spalte) und einer kurzen Erläuterung ihrer Bedeutung (fünfte Spalte) dargestellt. In abgewandelter Ausführungsform können jedoch auch zusätzliche Daten, oder aber nicht alle in Tabelle 1 angegebenen Daten, erfaßt und bei einem Störfall umgespeichert werden. Da die Tabelle 1 aus sich selbst heraus verständlich ist, erübrigen sich weitere diesbezügliche Erläuterungen.
Die erfindungsgemäße Umspeicherfunktion, bei der die Rechner­ zustandsdaten von dem Hauptspeicher auf einen externen Daten­ träger umgespeichert werden, wird jedesmal dann ausgeführt, wenn eine Anlaufstufe mit teilweiser oder vollständiger For­ matierung des Hauptspeichers durchgeführt werden muß. Wenn unterschiedliche Anlaufstufen vorhanden sind, bei denen min­ destens eine auf höherer Stufe liegt und keine Neuformatie­ rung des Hauptspeichers mit Laden des Betriebssystems erfor­ dert, wird erfindungsgemäß unterschieden, ob die durchzufüh­ rende Anlaufstufe mit einem (selektiven oder vollständigen) Neuformatieren des Hauptspeichers verknüpft ist. Die Umspei­ cherfunktion wird lediglich dann ausgeführt, wenn erfaßt wird, daß eine Anlaufstufe mit mindestens teilweiser Neufor­ matierung des Hauptspeichers durchzuführen ist. Hierzu wird die Umspeicherfunktion vorzugsweise in einer Basisprogramme­ bene abgelegt, die bei einem Wieder-Hochfahren mit erneutem Laden des Betriebssystems abgearbeitet wird, und zwar noch vor dem Laden des Betriebssystems.
Die erfindungsgemäße, die Umspeicherung der relevanten Rech­ nerzustandsinformationen aus dem Hauptspeicher auf den exter­ nen Datenträger bewirkende Umspeicherfunktion benötigt Infor­ mationen über die Adresse und die Länge der zu sichernden Da­ ten in dem Hauptspeicher. Sofern unterschiedliche, auf unter­ schiedlichen Interrupt-Leveln arbeitende Programm, zum Bei­ spiel Supervisor-Software und Benutzer-Software vorhanden sind, kann die Umspeicherfunktion zwei Interface-Prozeduren bereitstellen, die bei einem Wieder-Hochfahren entsprechend aufgerufen werden. Sofern die durch die Benutzer-Software be­ reitgestellten Adressen aufgrund der internen Systemgestal­ tung lediglich in logischem Format vorliegen sollten, wandelt die Umspeicherfunktion diese Daten in den entsprechenden phy­ sikalischen Bereich um, indem eine entsprechende Umwandlungs­ progammroutine, zum Beispiel eine Betriebssystem-Schnittstel­ le, aufgerufen wird.
In Fig. 2 ist der Ablauf der Datenumspeicherung bei einer Haupt-Plattform MP-SA eines elektronischen Wählvermittlungs­ systems dargestellt. Vor einem Störfall-bedingten, erneuten Anlauf des Prozessors (Schritt 1) werden von der Benutzer- Software und den sonstigen Komponenten Rechnerzustandsdaten kontinuierlich in den Hauptspeicher der Haupt-Plattform ein­ geschrieben und eine entsprechende Angabe über Speicheradres­ se und Bereichslänge fortlaufend aktualisiert. Bei der zu ei­ ner Neu-Formatierung des Hauptspeichers führenden Anlaufstufe (Schritt 1) wird dann bei einem Schritt 2 vor dem Laden des Betriebssystems ein Zugriff zu den Rechnerzustandsdaten des Hauptspeichers durchgeführt und diese bei einem Schritt 3 auf der Festplatte gespeichert. Anschließend wird bei einem Schritt 4 aufgrund des Hochfahrens des Rechners erneut der normale Arbeitsbetrieb erreicht.
Damit die gesicherten, den Rechnerzustand bei Auftreten des gravierenden Fehlers angebenden Rechnerzustandsdaten für eine Fehleranalyse und ggf. -behebung ausgewertet werden können, ist vorzugsweise eine Datenumwandlungsprozedur vorgesehen, die zum Beispiel durch eine Q3-Anforderung eines Basistermi­ nals BCT (basic craft terminal) aufgerufen wird (Schritt 5). Durch diese Anforderung wird der Prozessor dazu veranlaßt, die gesicherten Rechnerzustandsdaten von der Festplatte zu lesen, die Daten zu identifizieren und die entsprechende Um­ wandlungsroutine für jede Datenart aufzurufen (Schritte 7, 8). Die entsprechend aufbereiteten, formatierten Daten werden dann erneut auf der Platte über die Q3-Schnittstelle in eine separate Ausgabedatei eingeschrieben (Schritte 9, 10). Diese Datei kann über eine Q3-Anforderung für eine Datenanalyse oder dergleichen ausgelesen werden. Die Ausgabedatei läßt sich dann zum Betriebssystem, beispielsweise zum Telekommuni­ kationsmanagement-Betriebssystem, übertragen.
Bei der vorliegenden Ausführungsform ist der vorstehend er­ läuterte Datenumwandlungs-Steuerprozeß lediglich auf der Haupt-Plattform vorgesehen, so daß zur Aufbereitung von gesi­ cherten Rechnerzustandsdaten, die von anderen Rechnereinhei­ ten, z. B. von abhängigen Plattformen, stammen, auf die Haupt- Plattform zugegriffen wird.
Der Datenumwandlungssteuerprozeß kann durch den jeweiligen Benutzer selbst vorgenommen und aufgerufen werden, insbeson­ dere über die Q3-Anforderung.
In Fig. 3 sind die Schnittstellen und Funktionseinheiten für die Rechnerzustandsdaten-Aufzeichnung und Umspeicherung in Form eines Schaubilds dargestellt. Während des normalen Rech­ nerbetriebs werden bei der Programmabarbeitung, zum Beispiel durch die Benutzer-Software 11, logische Adressen der später gegebenenfalls zu sichernden Daten zur Verfügung gestellt, die durch die einen Bestandteil des erfindungsgemäßen Verfah­ rens darstellende Umwandlungsfunktion 12 in physikalische Adressen umgewandelt werden. Sowohl die logischen als auch die physikalischen Informationen (Adressen) werden dann in der Tabelle im Hauptspeicher gespeichert.
Bei einem durch einen gravierenden Störfall bedingten Wieder­ anlauf des Rechners werden in einer Boot-Stufe, zum Beispiel der Boot-Stufe 3 (Block 15) die Daten aus dem Hauptspeicher ausgelesen und auf die Festplatte 17 mit Hilfe eines Systems 16 für Off-Line-Filing gespeichert.
Nach erfolgreichem Hochlauf kann wieder On-Line über eine Q3-An­ forderung (Block 18) ein Abruf der auf der Festplatte 17 gespeicherten Rechnerzustandsdaten und eine Formatierung der­ selben unter Aufruf von Umwandlungsroutinen (Blöcke 19, 20) durchgeführt werden. Die umgewandelten, formatierten Daten können über ein On-Line-Filing-System 21 wieder auf die Fest­ platte 17 zurückgeschrieben werden oder auch über eine Über­ tragungs-Routine 22 auf eine Festplatte 23 gespeichert wer­ den. Bei dem erfindungsgemäßen Verfahren werden alle relevan­ ten Informationen, zum Beispiel die physikalischen und logi­ schen Adressen, in einer internen Tabelle in dem Hauptspei­ cher gespeichert, wobei die Tabelle an einer bestimmten phy­ sikalischen Adresse angeordnet ist. Hierdurch wird sicherge­ stellt, daß die Tabelle, das heißt die Informationen, beim Wieder-Hochfahren des Rechners (zum Beispiel bei der Boot-Stufe 3 bei der ultimativen Haupt-Plattform bzw. bei der Boot-Stufe 2 bei der abhängigen Plattform), gelesen werden können. Bei einer solchen Anlaufstufe, die ein mindestens teilweises Formatieren des Hauptspeichers beinhaltet, werden die Daten über das Off-Line-Filing-System 16 in eine separate Datei auf der Festplatte 17 umgespeichert, wenn die Haupt- Plattform nach einem Störfall wieder hochgefahren wird.
In Fig. 4 ist der Ablauf der Umspeicherfunktion bei einer ab­ hängigen Plattform MP-D dargestellt. Wenn bei einer abhängi­ gen Plattform 24 ein Störfall auftritt, der ein Wieder-Hoch­ fahren mit erneutem Laden des Betriebssystems erfordert, wird dies durch die Haupt-Plattform 25 aufgrund der von der abhän­ gigen Plattform 24 ausbleibenden Signale Resynch mittels ei­ ner Routine HWFP 26 (Hardware-Fehlerverarbeitung) erkannt. Wenn danach durch die Haupt-Plattform 25 die Entscheidung zur Reaktivierung, das heißt zum Wieder-Hochfahren der abhängigen Plattform 24 getroffen wird, wird ein Konfigurations-Verwal­ tungsprogramm CONF in der Haupt-Plattform gestartet, das zum Wieder-Hochfahren der abhängigen Plattform 24 dient. Das Pro­ gramm CONF 27 bewirkt dann die Aussendung eines Triggersi­ gnals 28 an die abhängige Plattform 24, um hierdurch eine Da­ tenübertragung 29 aus dem Hauptspeicher der abhängigen Platt­ form 24 zu der Haupt-Plattform 25 einzuleiten. Das Programm CONF ruft somit die Umspeicherfunktion zur Umspeicherung der Rechnerzustandsdaten auf, die bei dem Datenübertragungs­ schritt 29 aus dem Hauptspeicher der Plattform 24 zur Haupt- Plattform 25 übertragen werden. Diese Datenübertragung ist aufgrund des durch den Adressenpointer und die Bereichslänge klar definierten zusammenhängenden Speicherbereichs des Hauptspeichers der Plattform 24 rasch abgeschlossen, so daß die Aktivierung der abhängigen Plattform 24 nicht nennenswert verzögert wird.
Hierbei wird durch das Triggersignal 28 die erfindungsgemäße Umspeicherfunktion in der abhängigen Plattform 24 aufgerufen, wobei in diesem Fall die Haupt-Plattform 25 als externer Da­ tenträger dient. Anschließend werden diese zunächst im Haupt­ speicher der Haupt-Plattform 25 gespeicherten, den Hardware- und Softwarezustand der abhängigen Plattform 24 vor und beim Störfall anzeigenden Rechnerzustandsdaten bei einem Übertra­ gungsschritt 30 mittels eines On-Line-Filing-Systems 31 auf einer Festplatte gesichert. Durch das Programm CONF 27 wird die erfindungsgemäße Umspeicherfunktion bei allen automati­ schen Aktivierungen der abhängigen Plattformen 24 eingelei­ tet. Falls jedoch in einer abhängigen Plattform 24 ein Reset durch Spannungsunterbrechung bei der abhängigen Plattform 24 ausgelöst wurde, besteht die Gefahr, daß der Speicherinhalt der abhängigen Plattform gestört ist. In diesem Fall werden daher vorzugsweise keine Daten von einer solchen abhängigen Plattform aufgenommen.
Nach dem Abschluß der Datenumspeicherung kann der Hauptspei­ cher der betreffenden Rechnereinheit selektiv oder vollstän­ dig formatiert werden, ohne daß dies negative Einflüsse auf die Fehleranalyse und -behebung ausübt.
Falls gleichzeitig Daten von mehr als einer abhängigen Platt­ form 24 gesichert werden sollen, werden zunächst die Rechner­ zustandsdaten lediglich von derjenigen abhängigen Plattform gesichert, deren Umspeicherfunktion zuerst aufgerufen wurde. Alle anderen Anforderungen hinsichtlich einer Umspeicherung werden zurückgewiesen, bis der ablaufende Umspeichervorgang abgeschlossen ist. Erst nach Abschluß des ersten Umspeicher­ vorgangs werden dann aufeinanderfolgend die Rechnerzustands­ daten von weiteren, hochzufahrenden Plattformen gesichert.
Vorzugsweise kann zur Erleichterung der automatischen Verar­ beitung und der Übertragung der zu sichernden Daten in dem Betriebssystem vorgesehen sein, daß die Dateien, in die die gesicherten Daten eingeschrieben werden, mit entsprechenden, systemangepaßten Dateinamen versehen werden. Hierbei kann vorgesehen sein, daß für die Haupt-Plattform maximal vier Da­ teien für die gesicherten Rechnerzustandsdaten gebildet wer­ den, während maximal acht Dateien für die abhängenden Platt­ formen vorgesehen sind. Bei dem erfindungsgemäßen Verfahren können somit die Rechnerzustandsdaten (Symptome oder Fehle­ rindizien) nicht nur in einem beim Wiederhochlaufen nicht um­ formatierten Datenträger gespeichert, sondern auch in ein Format umgewandelt werden, das für eine Benutzer-Eingabe/Aus­ gabe (Benutzer-I/O) geeignet ist.
Weiterhin können die Rechnerzustandsdaten auch Informationen über alle wichtigen peripheren Geräte, zum Beispiel über de­ ren Betriebszustand, enthalten. Weiterhin werden bei Erken­ nung von Software-Fehlern vorzugsweise die folgenden Rechner­ zustandsdaten gespeichert: Modulname, Softwarefehler-Nummer, Anlaufstufe, Interrupt-Adresse, Prozessor-Name und letzter aktiver Prozeß.
Die Rechnerzustandsdaten beinhalten auch den Sicherungsbe­ reich für die Softwarefehlerbehandlung SWET. Dieser Bereich enthält alle Fehlermeldungen, die bei Softwarefehler-Meldun­ gen gemeldet wurden, genauer gesagt, alle mitgeteilten, aber noch nicht in einer Fehlermeldungs-Datei gesicherten Softwa­ refehler-Informationen.
Ferner können Systemüberwachungs-Daten bei Reaizeitfehlern gespeichert werden. Darüber hinaus können Fehleraufzeichnun­ gen (Symptomdatenaufzeichnungen) in den Rechnerzustandsdaten enthalten sein, soweit diese noch nicht in einer eigenen Si­ cherheitsmaßnahmen-Datei gespeichert wurden, die auch beim Wieder-Hochfahren des Rechners unbeschädigt bleibt. Weiterhin können die Rechnerzustandsdaten relevante Information über den aktuellen und den letzten Hochlauf und/oder Fehlerindizi­ en bei den letzten Hochlaufvorgängen enthalten. Ferner kann ein Hardware-Kommunikationsbereich ebenfalls in den Rechner­ zustandsdaten enthalten sein, so daß dieser durch die erfin­ dungsgemäße Umspeicherfunktion gleichfalls gesichert wird.
Zu den Rechnerzustandsdaten, die in Fig. 1 gezeigt sind, kön­ nen auch alle Fehlermeldungen gerechnet werden, die ihrer­ seits nicht selbst zu einem Anlauf des Rechners führen. Diese Fehlermeldungen enthalten auch Aussagen über die Zustände der Peripherie-Geräte. Hierbei können zwei Tabellen vorgesehen sein, wobei in einer Tabelle lediglich die Fehlermeldungen bei dem aktuellen Störfall enthalten sind. Diese Informatio­ nen werden lediglich dann gesichert, wenn ein vollständiger Ausfall der Peripherie zu verzeichnen ist. In der weiteren Tabelle werden die Fehlermeldungen gespeichert, die bei frü­ heren Störfällen aufgetreten waren.
Die Rechnerzustandsdaten können zudem auch zentrale Konfigu­ rationsdaten über die einzelnen Zustände der zentralen Ein­ heiten enthalten.
Falls es bei dem Hochfahren des Rechners aus irgendwelchen Gründen nicht möglich sein sollte, die Rechnerzustandsdaten auf die Festplatte umzuspeichern, kann statt dessen eine ent­ sprechende Information in dem Kommunikationsbereich gespei­ chert und am Abschluß des Hochlaufs ausgegeben werden.
Die Darstellung der Fehlermeldungen auf einem Monitor und das Einschreiben auf die Festplatte können unter Verwendung des BIOS-Systems durchgeführt werden. Durch die erfindungsgemäße Umspeicherung lassen sich hierbei auch Verzögerungen vermei­ den, die bei Einsatz einer Prozeß-Kommunikation auftreten würden.
Bezugszeichenliste
1
bis
10
Arbeitsschritte
11
Benutzer-Software
12
Umwandlung
13
Betriebssystem
14
Steuersoftware
15
Datenholung
16
Off-line-Filing-System
17
Festplatte
18
Q3-Anforderung
19
Formatierung
20
Benutzer-Software
21
On-line-Filing-System
22
Übertragungs-Routine
23
Festplatte
24
Plattform
25
Haupt-Plattform
26
HWFP-Routine
27
CONF-Programm
28
Triggersignal
29
Daten-Übertragung
30
Übertragungsschritt
31
On-line-File-System

Claims (6)

1. Verfahren zur Speicherung von den Zustand eines Rechners charakterisierenden Rechnerzustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfor­ dert,
bei dem die Rechnerzustandsdaten fortlaufend in dem Haupt­ speicher des Rechners gespeichert werden, und
die Rechnerzustandsdaten bei dem Wieder-Hochfahren des Rech­ ners vor dem Formatieren des Hauptspeichers aus diesem ausge­ lesen und auf einen Datenträger umgespeichert werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeich­ net, daß die Umspeicherfunktion beim Durchlaufen der Urlade­ funktion aufgerufen wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekenn­ zeichnet, daß für den Zugriff zu den Rechnerzustandsdaten die Anfangsadresse und der Umfang des diese Rechnerzustands­ daten enthaltenden Bereichs des Hauptspeichers angegeben wer­ den.
4. Verfahren nach einem der vorhergehenden Ansprüche, da­ durch gekennzeichnet, daß die auf den Datenträger umgespeicherten, in binärer Form vorliegenden Rechnerzu­ standsdaten aufbereitet und in eine lesbare, symbolische Form gebracht werden.
5. Verfahren nach einem der vorhergehenden Ansprüche, da­ durch gekennzeichnet, daß beim Wieder-Hochfahren des Rechners nach einem Störfall überprüft wird, ob die Anlauf­ stufe ein Neu-Formatieren des Hauptspeichers beinhaltet, und die Umspeicherfunktion bei einem Hochfahren ohne Neu-Forma­ tierung des Hauptspeichers nicht aufgerufen wird.
6. Verfahren nach einem der vorhergehenden Ansprüche, da­ durch gekennzeichnet, daß die Rechnerzustandsdaten Rücksetzanforderungen, die von Hardware-Komponenten oder Software-Komponenten erzeugt wurden, und/oder Informationen über Anforderungen einer Software-Fehlerverarbeitung und/oder die geforderte Anlaufstufe und/oder Diagnoseergebnisse bezüg­ lich der Rechnereinheit und der Festplatte enthalten.
DE19827432A 1997-07-25 1998-06-19 Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert Expired - Fee Related DE19827432C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP97112883 1997-07-25

Publications (2)

Publication Number Publication Date
DE19827432A1 true DE19827432A1 (de) 1999-01-28
DE19827432C2 DE19827432C2 (de) 2001-07-26

Family

ID=8227125

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19827432A Expired - Fee Related DE19827432C2 (de) 1997-07-25 1998-06-19 Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert

Country Status (2)

Country Link
US (1) US6279120B1 (de)
DE (1) DE19827432C2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004001819A1 (de) * 2004-01-07 2005-08-04 Siemens Ag Redundante Rechnerkonfiguration
DE102004047363A1 (de) * 2004-09-29 2006-03-30 Siemens Ag Prozessor bzw. Verfahren zum Betreiben eines Prozessors und/oder Betriebssystems im Fall einer Störung

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0902368A1 (de) * 1997-07-23 1999-03-17 Siemens Aktiengesellschaft Verfahren zum Wiederanlauf eines Rechnersystems
EP1085396A1 (de) * 1999-09-17 2001-03-21 Hewlett-Packard Company Betrieb von gesicherten Zustand in einer Computerplattform
US7111307B1 (en) 1999-11-23 2006-09-19 Microsoft Corporation Method and system for monitoring and verifying software drivers using system resources including memory allocation and access
US6810493B1 (en) * 2000-03-20 2004-10-26 Palm Source, Inc. Graceful recovery from and avoidance of crashes due to notification of third party applications
US6728907B1 (en) * 2000-04-14 2004-04-27 Microsoft Corporation System and method for self-diagnosing system crashes
US20020083362A1 (en) * 2000-12-22 2002-06-27 Objectsoft Corp. System and method for providing unattended personality acquisition, self-recovery and remote maintenance to internet-based end-user devices
US7062677B1 (en) * 2001-08-09 2006-06-13 Cisco Tech Inc Method for capturing core dump of a service module
US20040025081A1 (en) * 2002-07-31 2004-02-05 Jorge Gonzalez System and method for collecting code coverage information before file system is available
WO2004038643A2 (en) * 2002-10-25 2004-05-06 Mcpheely Bernard M Digital diagnosti video system for manufacturing and industrial process
US7308609B2 (en) * 2004-04-08 2007-12-11 International Business Machines Corporation Method, data processing system, and computer program product for collecting first failure data capture information
US7788537B1 (en) * 2006-01-31 2010-08-31 Emc Corporation Techniques for collecting critical information from a memory dump
US7533314B2 (en) * 2006-08-10 2009-05-12 Microsoft Corporation Unit test extender
US8539200B2 (en) * 2008-04-23 2013-09-17 Intel Corporation OS-mediated launch of OS-independent application
US8631186B2 (en) 2008-09-30 2014-01-14 Intel Corporation Hardware and file system agnostic mechanism for achieving capsule support
CN109684133A (zh) * 2018-12-20 2019-04-26 林琳 一种计算机死机状态自动重启方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1242809A (en) * 1985-12-20 1988-10-04 Mitel Corporation Data storage system
US4740969A (en) * 1986-06-27 1988-04-26 Hewlett-Packard Company Method and apparatus for recovering from hardware faults
JP2696511B2 (ja) 1987-07-09 1998-01-14 沖電気工業株式会社 パワーダウンモードからの復帰方式
US5021963A (en) 1988-12-30 1991-06-04 Pitney Bowes Inc. EPM having an improvement in accounting update security
US5151987A (en) * 1990-10-23 1992-09-29 International Business Machines Corporation Recovery objects in an object oriented computing environment
JPH056295A (ja) * 1991-06-27 1993-01-14 Nec Eng Ltd 情報処理装置のダンプ方式
JP3481737B2 (ja) * 1995-08-07 2003-12-22 富士通株式会社 ダンプ採取装置およびダンプ採取方法
JP3493368B2 (ja) * 1995-08-11 2004-02-03 富士通株式会社 通信システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004001819A1 (de) * 2004-01-07 2005-08-04 Siemens Ag Redundante Rechnerkonfiguration
DE102004047363A1 (de) * 2004-09-29 2006-03-30 Siemens Ag Prozessor bzw. Verfahren zum Betreiben eines Prozessors und/oder Betriebssystems im Fall einer Störung

Also Published As

Publication number Publication date
DE19827432C2 (de) 2001-07-26
US6279120B1 (en) 2001-08-21

Similar Documents

Publication Publication Date Title
DE19827432C2 (de) Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert
DE102005022192B4 (de) Datensicherungs-Laufwerk mit auswechselbaren Speichermedien zum Sichern von Daten eines Hostcomputers
DE2428348C2 (de) Verfahren zur Weiterbenutzung eines fehlerhaften Datenspeichers und Einrichtung zur Durchführung dieses Verfahrens
DE4040927C2 (de) Verfahren und Vorrichtung zur Fehlerspeicherung in einer Steuereinrichtung eines Kraftfahrzeugs
DE19740525C1 (de) Verfahren zur Abspeicherung und Wiedergewinnung von Daten in einem Steuersystem, insbesondere in einem Kraftfahrzeug
DE60025043T2 (de) Vorrichtung und verfahren mit verwendung von anwendungabhängigkeitsinformation für eine sicherungskopieherstellung in einem computersystem
DE10211606A1 (de) Datenverarbeitungseinrichtung
CH629901A5 (de) Verfahren zum steuern einer textverarbeitungseinrichtung beim speichern und lesen von text.
DE2458285C2 (de) Periphere Steuerung
DE4305522A1 (de) Einrichtung zur automatischen Erzeugung einer Wissensbasis für ein Diagnose-Expertensystem
DE2450468C2 (de) Fehlerkorrekturanordnung für einen Speicher
EP1924916A2 (de) Speicheranordnung und betriebsverfahren dafür
EP0572019B1 (de) Verfahren zum Betreiben einer Datenverarbeitungsanlage
EP2539899B1 (de) Verfahren zur überprüfung der funktionsfähigkeit eines speicherelements
EP0433350A1 (de) Betriebsprogramm für eine datenverarbeitungsanlage
DE102019132679A1 (de) Überwachungsverfahren für cpu-nutzungsmenge im betrieb von fahrzeug-ecu und überwachungseinheit
DE1966991C3 (de) Ausfallgesicherte Datenverarbeitungsanlage
DE2823457C2 (de) Schaltungsanordnung zur Fehlerüberwachung eines Speichers einer digitalen Rechenanlage
EP1750283B1 (de) Überprüfung eines Adressdecoders
DE3535215A1 (de) Verfahren und schaltungsanordnung zum lesen von daten aus dem speicher einer datenverarbeitungsanlage
EP0151810A2 (de) Verfahren und Schaltungsanordnung zum Prüfen eines Programms in Datenverarbeitungsanlagen
DE19636384C2 (de) Vorrichtung zur Fehlerdiagnose sowie Verfahren zur Fehlerdiagnose
WO2000017754A1 (de) Verfahren zur erfassung des datenzustandes
DE102019208129B4 (de) Elektronische Steuereinheit
DE3927703A1 (de) Computersystem vom gemeinschaftsdaten-typ

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee