DE19827432A1

DE19827432A1 - Verfahren zur Speicherung von Rechner-Zustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfordert

Info

Publication number: DE19827432A1
Application number: DE19827432A
Authority: DE
Inventors: Horst Ripken; Franz Schroeder; Gulbicki Zbigniew; Petro Istavrinos
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 1997-07-25
Filing date: 1998-06-19
Publication date: 1999-01-28
Anticipated expiration: 2018-06-20
Also published as: DE19827432C2; US6279120B1

Description

Die Erfindung betrifft ein Verfahren zur Speicherung von den Zustand eines Rechners bei einem gravierenden Störfall be schreibenden Daten, die anschließend zur Fehleranalyse und gegebenenfalls Behebung eingesetzt werden können. Solche gra vierenden Störfälle können zum Beispiel durch Software- oder Hardwarefehler hervorgerufen werden und verhindern dann einen weiteren Normalbetrieb bzw. können gegebenenfalls auch zum gesamten Rechnerabsturz führen. Im allgemeinen sind hierbei keine Zustandsdaten vorhanden, die den Rechnerzustand unmit telbar vor und während des Störfalls protokollieren würden. Daher fehlt im allgemeinen die Möglichkeit, die Absturzursa che und auch den Fehler zu lokalisieren.

Hinzu tritt, daß manche Rechnereinheiten im Echtzeitbetrieb ständig verfügbar sein müssen, zum Beispiel bei digitalen Fernsprechvermittlungssystemen. Ein solcher Rechner wird nach einem Absturz normalerweise automatisch so fort wieder hochge fahren, wobei teilweise auch der Hauptspeicher neu formatiert wird. Ein weiteres Problem besteht auch darin, daß aufgrund der sofortigen Wiederinbetriebnahme des Rechners keine Mög lichkeit zur Fehlersuche verbleibt. Es ist daher sehr mühsam, die Absturzursache, das heißt Hardware- oder Softwarefehler, zielstrebig zu analysieren und zu beheben.

Zur Bereitstellung von Rechner-Zustandsinformationen unmit telbar vor einem gravierenden Störfall könnte überlegt wer den, während des Normalbetriebs ständig Daten über den Rech nerzustand zu protokollieren, um hieraus nach einem gravie renden Störfall die Fehlerursache analysieren zu können. Je doch können solche Daten aus Dynamikgründen nicht sofort ex tern, zum Beispiel auf einer Festplatte, gesichert werden, da ansonsten die Leistungsperformance des Rechners zu stark ein geschränkt würde. Solche Daten müßten daher periodisch oder bei Erreichen eines bestimmten Volumens, das heißt in größe ren Zeitabständen gesichert werden. Bei Auftreten eines gra vierenden Störfalls, der zu einem Wiederanlaufen des Rechners führt, wird dann aber häufig auch der Hauptspeicher neu for matiert, so daß dann die dort noch enthaltenen Zustandsinfor mationen überschrieben werden. Es fehlen dann aber die Zu standsinformationen für den kritischsten Zeitbereich, nämlich für den Zeitbereich zwischen dem letzten Sicherungszeitpunkt und dem Zeitpunkt des Störfalls, so daß die Fehleranalyse nur auf unvollständigem Datenmaterial beruhen kann.

Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur effektiven Speicherung von eine gute Fehleranalyse ermögli chenden Rechnerzustandsinformationen bei einem Störfall be reitzustellen.

Diese Aufgabe wird mit den im Patentanspruch 1 genannten Maß nahmen gelöst. Vorteilhafte Ausgestaltungen der Erfindung sind in den Unteransprüchen angegeben.

Bei dem erfindungsgemäßen Verfahren werden somit ständig In formationen über den Zustand des Rechners (Rechnerzu standsdaten) im Hauptspeicher gesammelt. Diese Informationen repräsentieren relevante Informationen aus jeweils gerade in Verarbeitung befindlichen oder laufenden Programmeinheiten und/oder Informationen über den Zustand von Hardwareeinhei ten, insbesondere von Fehlersignale generierenden Hardware komponenten. Damit steht im Hauptspeicher stets ein Informa tionsbereich zur Verfügung, der bei einem leichteren, kein Wieder-Hochfahren des Rechners erfordernden Störfall unmit telbar oder zu einem geeigneten Zeitpunkt ausgewertet werden kann, um hierdurch Fehler in den Software- und/oder Hardware komponenten zu analysieren und auszumerzen.

Wenn jedoch ein gravierender Störfall auftritt, der ein An laufen des Rechners mit vollständiger oder teilweiser Forma tierung des Hauptspeichers erfordert, würden diese Rechnerzu standsdaten im Hauptspeicher überschrieben werden, so daß die Informationen verloren gehen und keine Fehleranalyse mehr er möglichen. Zur Lösung dieses Problems ist bei dem erfindungs gemäßen Verfahren ein zusätzlicher Programmabschnitt vorgese hen, der eine Umspeicherung der Rechnerzustandsdaten von dem Hauptspeicher auf einen anderen Datenträger, zum Beispiel auf die Festplatte, bewirkt. Diese Umspeicherung wird in der An fangsphase des Hochfahrens noch vor dem Formatieren des Hauptspeichers und insbesondere noch vor dem Laden des Be triebssystems ausgeführt, das heißt in einem Zustand, bei dem der Hauptspeicherinhalt und damit die Rechnerzustandsdaten noch unverändert ist. Diese Rechnerzustandsdaten stehen dem zufolge auch nach dem Hochfahren des Rechners für eine sofor tige oder auch spätere Fehleranalyse zur Verfügung, die in tern oder extern durchgeführt werden kann. Da die Rechnerzu standsdaten bis unmittelbar zu dem Auftreten des Störfalls fortgeschrieben worden sind, beinhalten sie auch die aktuell sten Informationen, die eine bestmögliche Fehleranalyse zu lassen.

Bei einer Ausführungsform der Erfindung werden die Speicher bereiche des Hauptspeichers, in denen die Rechnerzustandsda ten gespeichert sind und die somit eine Datensammlungs-Tabel le bilden, einer zentralen Umspeicherfunktion insbesondere durch Übergabe der Hauptspeicheradresse und der Länge des Speicherbereichs mitgeteilt. Die Umspeicherfunktion ist hier bei derart ausgelegt, daß sie auch ohne Betriebssystemunter stützung arbeiten kann, da das Betriebssystem möglicherweise ebenfalls fehlerhaft sein kann bzw. eine verfälschte Daten haltung bewirkt. Die Umspeicherfunktion ist daher vorzugswei se softwaretechnisch als autonomer Abschnitt in den untersten Software-Schichten unterhalb des Betriebssystems realisiert. Die Umspeicherfunktion ist vorzugsweise in der Boot-Stufe an gesiedelt, das heißt liegt in der "Urlade-Software". Bei Auf treten einer schwerwiegenden Störung wird als Reaktion die Urladephase durchlaufen, so daß die Umspeicherfunktion ange stoßen wird und sich die Rechnerzustandsdaten aus dem ihr mitgeteilten Hauptspeicherbereich ausliest und über eine ele mentare Ein-/Ausgabe-Schnittstelle auf einen externen Daten träger ausgibt. Dieser Vorgang kann zeitlich optimal inner halb von wenigen Sekunden ablaufen, da die entsprechenden Da tenbereiche kompakt sehr rasch transferiert werden können und der Transport unmittelbar, das heißt ohne weiteren System- Overhead, abläuft.

Theoretisch könnte auch überlegt werden, die die Rechnerzu standsdaten enthaltenden Hauptspeicherbereiche bei der Spei cher-Neuformatierung auszuklammern, um ein Überschreiben die ser Daten zu verhindern. Jedoch könnte sich hierbei das mit der vorliegenden Erfindung vermiedene Problem ergeben, daß bei eventuellen, durch Systemfehler bedingten Verfälschungen dieser Daten der Rechner nach dem Hochlaufen aufgrund dieser verfälschten Hauptspeicher-Dateninhalte erneut fehlerhaft ar beitet und eventuell wieder abstürzt.

Aufgrund der erfindungsgemäßen Vorgehensweise können auch die Rechnerzustandsdaten-Speicherbereiche des Hauptspeichers nach der Umspeicherung neu formatiert werden, so daß in diesen Speicherbereichen eventuell vorhandene Datenverfälschungen neutralisiert werden.

Darüber hinaus ist bei schwereren Störfällen eine Neuforma tierung des gesamten Hauptspeichers unumgänglich, wobei auch solche für die Rechnerzustandsdaten reservierten Speicherbe reiche formatiert werden müssen.

Ferner läßt sich bei der erfindungsgemäßen Vorgehensweise der zu sicherende Speicherbereich durch fest programmierte Daten schnitt stellen, das heißt durch Pointer auf Datenstrukturen, festlegen, so daß auch Erweiterungen des benötigten Speicher platzes stets unter zentraler Kontrolle durchgeführt werden.

Durch die strikte Kontrolle des Rechnerzustandsdaten-Spei cherbereichs ist es darüber hinaus auch präzise möglich, die durch Umspeicherung gesicherten Rechnerzustandsdaten in les bare Form aufzubereiten. Die gesicherten Informationen sind nämlich im allgemeinen binär und damit nicht lesbar. In vor teilhafter Ausgestaltung werden diese Rechnerzustandsdaten daher nach erfolgreichem Hochlauf wieder von dem externen Da tenträger, zum Beispiel der Platte, eingelesen und aufberei tet und hierdurch in eine lesbare, symbolische Form gebracht. Anhand dieser aufbereiteten Daten läßt sich dann die Fehler suche und -analyse durchführen. Die aufbereiteten Daten las sen sich ihrerseits auf einem Datenträger, zum Beispiel auf der Festplatte, abspeichern, und stehen in diesem Fall auch für eine eventuelle spätere Fehleranalyse oder eine Fehler protokollierung zur Verfügung. Die Datenaufbereitungsfunktion muß jedoch nicht zwingend im Rechner selbst On-Line stattfin den, sondern kann auch Off-Line erfolgen.

Bei dem erfindungsgemäßen Verfahren wird somit die Umspei cherfunktion auf einer Ebene unterhalb des Betriebssystems bereitgestellt und erlaubt eine effektive Sicherung der rele vanten Rechnerzustandsdaten (Fehlerindizien) in einem akuten, gravierenden Störfall mit maximaler zeitlicher Optimierung. Mit den gesicherten, gegebenenfalls aufbereiteten Rechnerzu standsdaten wird somit die aktuelle Situation zum Zeitpunkt des Störfalls angezeigt, so daß der Fehler schnell analysiert und lokalisiert werden kann.

Die Erfindung wird nachstehend anhand eines Ausführungsbei spiels unter Bezugnahme auf die Zeichnungen näher beschrie ben. Hierbei zeigen:

Fig. 1 in Form einer Tabelle zu sichernde Rechnerzustandsda ten,

Fig. 2 ein Flußbild der Umspeicherfunktion bei einem Stör fall der Haupt-Plattform,

Fig. 3 Schnittstellen und Funktionseinheiten für die Spei cherung von Rechnerzustandsdaten bei der Haupt-Platt form, und

Fig. 4 den Ablauf der Datenspeicherung und -umspeicherung bei einem Störfall einer abhangigen Plattform.

Rechnerzustandsdaten, das heißt als Fehler-Indizien bei Stör fällen in ausfallsicheren Systemen verwendbare Daten, werden bei dem erfindungsgemäßen Verfahren fortlaufend in einem nicht gezeigten Hauptspeicher der Rechnereinheit (Prozessor einheit) gespeichert. Bei solchen Rechnereinheiten kann es sich zum Beispiel um die Haupt-Plattform (ultimative Haupt prozessor-Steuerung MP-SA) und/oder um abhängige Plattformen (abhängige Hauptprozessoren MP-D) handeln, die insbesondere in elektronischen Vermittlungssystemen für Telekommunikati ons-Vermittlung zum Einsatz kommen. Die Erfindung kann aber auch bei anderen Systemen angewendet werden und erlaubt auch bei solchen anderen Systemen ein sofortiges Wieder-Hochfahren einer Rechnereinheit nach einem Absturz oder einem nur durch Wieder-Anlauf des Systems behebbaren Fehler, ohne daß die fortlaufend fortgeschriebenen, den Rechnerzustand bis zum Ab sturz protokollierenden Zustandsdaten verloren gehen. In der anliegenden Fig. 1 sind in Form einer Tabelle die fortlaufend registrierten und bei einem Wieder-Hochfahren des Rechners vor dem Laden des Betriebssystem ausgelagerten Rechnerzu standsdaten (Fehlerindizien, siehe linke Spalte), einschließ lich ihrer ungefähren Größe (zweite Spalte), ihrem Ort; Haupt-Plattform MP-SA oder abhängige Plattform MP-D (mittlere Spalte), der Anlaufstufe, während der die Daten im Hauptspei cher überschrieben werden (vierte Spalte) und einer kurzen Erläuterung ihrer Bedeutung (fünfte Spalte) dargestellt. In abgewandelter Ausführungsform können jedoch auch zusätzliche Daten, oder aber nicht alle in Tabelle 1 angegebenen Daten, erfaßt und bei einem Störfall umgespeichert werden. Da die Tabelle 1 aus sich selbst heraus verständlich ist, erübrigen sich weitere diesbezügliche Erläuterungen.

Die erfindungsgemäße Umspeicherfunktion, bei der die Rechner zustandsdaten von dem Hauptspeicher auf einen externen Daten träger umgespeichert werden, wird jedesmal dann ausgeführt, wenn eine Anlaufstufe mit teilweiser oder vollständiger For matierung des Hauptspeichers durchgeführt werden muß. Wenn unterschiedliche Anlaufstufen vorhanden sind, bei denen min destens eine auf höherer Stufe liegt und keine Neuformatie rung des Hauptspeichers mit Laden des Betriebssystems erfor dert, wird erfindungsgemäß unterschieden, ob die durchzufüh rende Anlaufstufe mit einem (selektiven oder vollständigen) Neuformatieren des Hauptspeichers verknüpft ist. Die Umspei cherfunktion wird lediglich dann ausgeführt, wenn erfaßt wird, daß eine Anlaufstufe mit mindestens teilweiser Neufor matierung des Hauptspeichers durchzuführen ist. Hierzu wird die Umspeicherfunktion vorzugsweise in einer Basisprogramme bene abgelegt, die bei einem Wieder-Hochfahren mit erneutem Laden des Betriebssystems abgearbeitet wird, und zwar noch vor dem Laden des Betriebssystems.

Die erfindungsgemäße, die Umspeicherung der relevanten Rech nerzustandsinformationen aus dem Hauptspeicher auf den exter nen Datenträger bewirkende Umspeicherfunktion benötigt Infor mationen über die Adresse und die Länge der zu sichernden Da ten in dem Hauptspeicher. Sofern unterschiedliche, auf unter schiedlichen Interrupt-Leveln arbeitende Programm, zum Bei spiel Supervisor-Software und Benutzer-Software vorhanden sind, kann die Umspeicherfunktion zwei Interface-Prozeduren bereitstellen, die bei einem Wieder-Hochfahren entsprechend aufgerufen werden. Sofern die durch die Benutzer-Software be reitgestellten Adressen aufgrund der internen Systemgestal tung lediglich in logischem Format vorliegen sollten, wandelt die Umspeicherfunktion diese Daten in den entsprechenden phy sikalischen Bereich um, indem eine entsprechende Umwandlungs progammroutine, zum Beispiel eine Betriebssystem-Schnittstel le, aufgerufen wird.

In Fig. 2 ist der Ablauf der Datenumspeicherung bei einer Haupt-Plattform MP-SA eines elektronischen Wählvermittlungs systems dargestellt. Vor einem Störfall-bedingten, erneuten Anlauf des Prozessors (Schritt 1) werden von der Benutzer- Software und den sonstigen Komponenten Rechnerzustandsdaten kontinuierlich in den Hauptspeicher der Haupt-Plattform ein geschrieben und eine entsprechende Angabe über Speicheradres se und Bereichslänge fortlaufend aktualisiert. Bei der zu ei ner Neu-Formatierung des Hauptspeichers führenden Anlaufstufe (Schritt 1) wird dann bei einem Schritt 2 vor dem Laden des Betriebssystems ein Zugriff zu den Rechnerzustandsdaten des Hauptspeichers durchgeführt und diese bei einem Schritt 3 auf der Festplatte gespeichert. Anschließend wird bei einem Schritt 4 aufgrund des Hochfahrens des Rechners erneut der normale Arbeitsbetrieb erreicht.

Damit die gesicherten, den Rechnerzustand bei Auftreten des gravierenden Fehlers angebenden Rechnerzustandsdaten für eine Fehleranalyse und ggf. -behebung ausgewertet werden können, ist vorzugsweise eine Datenumwandlungsprozedur vorgesehen, die zum Beispiel durch eine Q3-Anforderung eines Basistermi nals BCT (basic craft terminal) aufgerufen wird (Schritt 5). Durch diese Anforderung wird der Prozessor dazu veranlaßt, die gesicherten Rechnerzustandsdaten von der Festplatte zu lesen, die Daten zu identifizieren und die entsprechende Um wandlungsroutine für jede Datenart aufzurufen (Schritte 7, 8). Die entsprechend aufbereiteten, formatierten Daten werden dann erneut auf der Platte über die Q3-Schnittstelle in eine separate Ausgabedatei eingeschrieben (Schritte 9, 10). Diese Datei kann über eine Q3-Anforderung für eine Datenanalyse oder dergleichen ausgelesen werden. Die Ausgabedatei läßt sich dann zum Betriebssystem, beispielsweise zum Telekommuni kationsmanagement-Betriebssystem, übertragen.

Bei der vorliegenden Ausführungsform ist der vorstehend er läuterte Datenumwandlungs-Steuerprozeß lediglich auf der Haupt-Plattform vorgesehen, so daß zur Aufbereitung von gesi cherten Rechnerzustandsdaten, die von anderen Rechnereinhei ten, z. B. von abhängigen Plattformen, stammen, auf die Haupt- Plattform zugegriffen wird.

Der Datenumwandlungssteuerprozeß kann durch den jeweiligen Benutzer selbst vorgenommen und aufgerufen werden, insbeson dere über die Q3-Anforderung.

In Fig. 3 sind die Schnittstellen und Funktionseinheiten für die Rechnerzustandsdaten-Aufzeichnung und Umspeicherung in Form eines Schaubilds dargestellt. Während des normalen Rech nerbetriebs werden bei der Programmabarbeitung, zum Beispiel durch die Benutzer-Software 11, logische Adressen der später gegebenenfalls zu sichernden Daten zur Verfügung gestellt, die durch die einen Bestandteil des erfindungsgemäßen Verfah rens darstellende Umwandlungsfunktion 12 in physikalische Adressen umgewandelt werden. Sowohl die logischen als auch die physikalischen Informationen (Adressen) werden dann in der Tabelle im Hauptspeicher gespeichert.

Bei einem durch einen gravierenden Störfall bedingten Wieder anlauf des Rechners werden in einer Boot-Stufe, zum Beispiel der Boot-Stufe 3 (Block 15) die Daten aus dem Hauptspeicher ausgelesen und auf die Festplatte 17 mit Hilfe eines Systems 16 für Off-Line-Filing gespeichert.

Nach erfolgreichem Hochlauf kann wieder On-Line über eine Q3-An forderung (Block 18) ein Abruf der auf der Festplatte 17 gespeicherten Rechnerzustandsdaten und eine Formatierung der selben unter Aufruf von Umwandlungsroutinen (Blöcke 19, 20) durchgeführt werden. Die umgewandelten, formatierten Daten können über ein On-Line-Filing-System 21 wieder auf die Fest platte 17 zurückgeschrieben werden oder auch über eine Über tragungs-Routine 22 auf eine Festplatte 23 gespeichert wer den. Bei dem erfindungsgemäßen Verfahren werden alle relevan ten Informationen, zum Beispiel die physikalischen und logi schen Adressen, in einer internen Tabelle in dem Hauptspei cher gespeichert, wobei die Tabelle an einer bestimmten phy sikalischen Adresse angeordnet ist. Hierdurch wird sicherge stellt, daß die Tabelle, das heißt die Informationen, beim Wieder-Hochfahren des Rechners (zum Beispiel bei der Boot-Stufe 3 bei der ultimativen Haupt-Plattform bzw. bei der Boot-Stufe 2 bei der abhängigen Plattform), gelesen werden können. Bei einer solchen Anlaufstufe, die ein mindestens teilweises Formatieren des Hauptspeichers beinhaltet, werden die Daten über das Off-Line-Filing-System 16 in eine separate Datei auf der Festplatte 17 umgespeichert, wenn die Haupt- Plattform nach einem Störfall wieder hochgefahren wird.

In Fig. 4 ist der Ablauf der Umspeicherfunktion bei einer ab hängigen Plattform MP-D dargestellt. Wenn bei einer abhängi gen Plattform 24 ein Störfall auftritt, der ein Wieder-Hoch fahren mit erneutem Laden des Betriebssystems erfordert, wird dies durch die Haupt-Plattform 25 aufgrund der von der abhän gigen Plattform 24 ausbleibenden Signale Resynch mittels ei ner Routine HWFP 26 (Hardware-Fehlerverarbeitung) erkannt. Wenn danach durch die Haupt-Plattform 25 die Entscheidung zur Reaktivierung, das heißt zum Wieder-Hochfahren der abhängigen Plattform 24 getroffen wird, wird ein Konfigurations-Verwal tungsprogramm CONF in der Haupt-Plattform gestartet, das zum Wieder-Hochfahren der abhängigen Plattform 24 dient. Das Pro gramm CONF 27 bewirkt dann die Aussendung eines Triggersi gnals 28 an die abhängige Plattform 24, um hierdurch eine Da tenübertragung 29 aus dem Hauptspeicher der abhängigen Platt form 24 zu der Haupt-Plattform 25 einzuleiten. Das Programm CONF ruft somit die Umspeicherfunktion zur Umspeicherung der Rechnerzustandsdaten auf, die bei dem Datenübertragungs schritt 29 aus dem Hauptspeicher der Plattform 24 zur Haupt- Plattform 25 übertragen werden. Diese Datenübertragung ist aufgrund des durch den Adressenpointer und die Bereichslänge klar definierten zusammenhängenden Speicherbereichs des Hauptspeichers der Plattform 24 rasch abgeschlossen, so daß die Aktivierung der abhängigen Plattform 24 nicht nennenswert verzögert wird.

Hierbei wird durch das Triggersignal 28 die erfindungsgemäße Umspeicherfunktion in der abhängigen Plattform 24 aufgerufen, wobei in diesem Fall die Haupt-Plattform 25 als externer Da tenträger dient. Anschließend werden diese zunächst im Haupt speicher der Haupt-Plattform 25 gespeicherten, den Hardware- und Softwarezustand der abhängigen Plattform 24 vor und beim Störfall anzeigenden Rechnerzustandsdaten bei einem Übertra gungsschritt 30 mittels eines On-Line-Filing-Systems 31 auf einer Festplatte gesichert. Durch das Programm CONF 27 wird die erfindungsgemäße Umspeicherfunktion bei allen automati schen Aktivierungen der abhängigen Plattformen 24 eingelei tet. Falls jedoch in einer abhängigen Plattform 24 ein Reset durch Spannungsunterbrechung bei der abhängigen Plattform 24 ausgelöst wurde, besteht die Gefahr, daß der Speicherinhalt der abhängigen Plattform gestört ist. In diesem Fall werden daher vorzugsweise keine Daten von einer solchen abhängigen Plattform aufgenommen.

Nach dem Abschluß der Datenumspeicherung kann der Hauptspei cher der betreffenden Rechnereinheit selektiv oder vollstän dig formatiert werden, ohne daß dies negative Einflüsse auf die Fehleranalyse und -behebung ausübt.

Falls gleichzeitig Daten von mehr als einer abhängigen Platt form 24 gesichert werden sollen, werden zunächst die Rechner zustandsdaten lediglich von derjenigen abhängigen Plattform gesichert, deren Umspeicherfunktion zuerst aufgerufen wurde. Alle anderen Anforderungen hinsichtlich einer Umspeicherung werden zurückgewiesen, bis der ablaufende Umspeichervorgang abgeschlossen ist. Erst nach Abschluß des ersten Umspeicher vorgangs werden dann aufeinanderfolgend die Rechnerzustands daten von weiteren, hochzufahrenden Plattformen gesichert.

Vorzugsweise kann zur Erleichterung der automatischen Verar beitung und der Übertragung der zu sichernden Daten in dem Betriebssystem vorgesehen sein, daß die Dateien, in die die gesicherten Daten eingeschrieben werden, mit entsprechenden, systemangepaßten Dateinamen versehen werden. Hierbei kann vorgesehen sein, daß für die Haupt-Plattform maximal vier Da teien für die gesicherten Rechnerzustandsdaten gebildet wer den, während maximal acht Dateien für die abhängenden Platt formen vorgesehen sind. Bei dem erfindungsgemäßen Verfahren können somit die Rechnerzustandsdaten (Symptome oder Fehle rindizien) nicht nur in einem beim Wiederhochlaufen nicht um formatierten Datenträger gespeichert, sondern auch in ein Format umgewandelt werden, das für eine Benutzer-Eingabe/Aus gabe (Benutzer-I/O) geeignet ist.

Weiterhin können die Rechnerzustandsdaten auch Informationen über alle wichtigen peripheren Geräte, zum Beispiel über de ren Betriebszustand, enthalten. Weiterhin werden bei Erken nung von Software-Fehlern vorzugsweise die folgenden Rechner zustandsdaten gespeichert: Modulname, Softwarefehler-Nummer, Anlaufstufe, Interrupt-Adresse, Prozessor-Name und letzter aktiver Prozeß.

Die Rechnerzustandsdaten beinhalten auch den Sicherungsbe reich für die Softwarefehlerbehandlung SWET. Dieser Bereich enthält alle Fehlermeldungen, die bei Softwarefehler-Meldun gen gemeldet wurden, genauer gesagt, alle mitgeteilten, aber noch nicht in einer Fehlermeldungs-Datei gesicherten Softwa refehler-Informationen.

Ferner können Systemüberwachungs-Daten bei Reaizeitfehlern gespeichert werden. Darüber hinaus können Fehleraufzeichnun gen (Symptomdatenaufzeichnungen) in den Rechnerzustandsdaten enthalten sein, soweit diese noch nicht in einer eigenen Si cherheitsmaßnahmen-Datei gespeichert wurden, die auch beim Wieder-Hochfahren des Rechners unbeschädigt bleibt. Weiterhin können die Rechnerzustandsdaten relevante Information über den aktuellen und den letzten Hochlauf und/oder Fehlerindizi en bei den letzten Hochlaufvorgängen enthalten. Ferner kann ein Hardware-Kommunikationsbereich ebenfalls in den Rechner zustandsdaten enthalten sein, so daß dieser durch die erfin dungsgemäße Umspeicherfunktion gleichfalls gesichert wird.

Zu den Rechnerzustandsdaten, die in Fig. 1 gezeigt sind, kön nen auch alle Fehlermeldungen gerechnet werden, die ihrer seits nicht selbst zu einem Anlauf des Rechners führen. Diese Fehlermeldungen enthalten auch Aussagen über die Zustände der Peripherie-Geräte. Hierbei können zwei Tabellen vorgesehen sein, wobei in einer Tabelle lediglich die Fehlermeldungen bei dem aktuellen Störfall enthalten sind. Diese Informatio nen werden lediglich dann gesichert, wenn ein vollständiger Ausfall der Peripherie zu verzeichnen ist. In der weiteren Tabelle werden die Fehlermeldungen gespeichert, die bei frü heren Störfällen aufgetreten waren.

Die Rechnerzustandsdaten können zudem auch zentrale Konfigu rationsdaten über die einzelnen Zustände der zentralen Ein heiten enthalten.

Falls es bei dem Hochfahren des Rechners aus irgendwelchen Gründen nicht möglich sein sollte, die Rechnerzustandsdaten auf die Festplatte umzuspeichern, kann statt dessen eine ent sprechende Information in dem Kommunikationsbereich gespei chert und am Abschluß des Hochlaufs ausgegeben werden.

Die Darstellung der Fehlermeldungen auf einem Monitor und das Einschreiben auf die Festplatte können unter Verwendung des BIOS-Systems durchgeführt werden. Durch die erfindungsgemäße Umspeicherung lassen sich hierbei auch Verzögerungen vermei den, die bei Einsatz einer Prozeß-Kommunikation auftreten würden.

Bezugszeichenliste

1

bis

10

Arbeitsschritte

11

Benutzer-Software

12

Umwandlung

13

Betriebssystem

14

Steuersoftware

15

Datenholung

16

Off-line-Filing-System

17

Festplatte

18

Q3-Anforderung

19

Formatierung

20

Benutzer-Software

21

On-line-Filing-System

22

Übertragungs-Routine

23

Festplatte

24

Plattform

25

Haupt-Plattform

26

HWFP-Routine

27

CONF-Programm

28

Triggersignal

29

Daten-Übertragung

30

Übertragungsschritt

31

On-line-File-System

Claims

1. Verfahren zur Speicherung von den Zustand eines Rechners charakterisierenden Rechnerzustandsdaten bei einem Störfall, der ein anschließendes Wieder-Hochfahren des Rechners erfor dert,
bei dem die Rechnerzustandsdaten fortlaufend in dem Haupt speicher des Rechners gespeichert werden, und
die Rechnerzustandsdaten bei dem Wieder-Hochfahren des Rech ners vor dem Formatieren des Hauptspeichers aus diesem ausge lesen und auf einen Datenträger umgespeichert werden.

2. Verfahren nach Anspruch 1, dadurch gekennzeich net, daß die Umspeicherfunktion beim Durchlaufen der Urlade funktion aufgerufen wird.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekenn zeichnet, daß für den Zugriff zu den Rechnerzustandsdaten die Anfangsadresse und der Umfang des diese Rechnerzustands daten enthaltenden Bereichs des Hauptspeichers angegeben wer den.

4. Verfahren nach einem der vorhergehenden Ansprüche, da durch gekennzeichnet, daß die auf den Datenträger umgespeicherten, in binärer Form vorliegenden Rechnerzu standsdaten aufbereitet und in eine lesbare, symbolische Form gebracht werden.

5. Verfahren nach einem der vorhergehenden Ansprüche, da durch gekennzeichnet, daß beim Wieder-Hochfahren des Rechners nach einem Störfall überprüft wird, ob die Anlauf stufe ein Neu-Formatieren des Hauptspeichers beinhaltet, und die Umspeicherfunktion bei einem Hochfahren ohne Neu-Forma tierung des Hauptspeichers nicht aufgerufen wird.

6. Verfahren nach einem der vorhergehenden Ansprüche, da durch gekennzeichnet, daß die Rechnerzustandsdaten Rücksetzanforderungen, die von Hardware-Komponenten oder Software-Komponenten erzeugt wurden, und/oder Informationen über Anforderungen einer Software-Fehlerverarbeitung und/oder die geforderte Anlaufstufe und/oder Diagnoseergebnisse bezüg lich der Rechnereinheit und der Festplatte enthalten.