-
Gebiet der
Erfindung
-
Die
vorliegende Erfindung betrifft ein System und ein Verfahren für inhaltsabhängige Speicherverwaltung
und insbesondere ein System und ein Verfahren, wobei Entscheidungen
hinsichtlich des Speicherortes und/oder des Timings der Speicherung
von Daten vom Inhalt der Daten abhängig sind.
-
Allgemeiner
Stand der Technik
-
Speichereinrichtungen
für digitale
Informationen sind eine kritische Ressource. Der Bedarf an Speicherplatz
sowohl für
konventionelle Daten, wie beispielsweise Textdokumente und andere
vom Menschen lesbare Dateien, als auch für Multimedia-Streams, wie beispielsweise
Audio- und/oder Videodaten, hat enorm zugenommen. Diese Zunahme ist
das Ergebnis einer Reihe unterschiedlicher Faktoren, wie beispielsweise
rechtliche Vorgaben zur Speicherung und Pflege bestimmter Arten
von Informationen; eine Zunahme der verschiedenen Arten von Daten,
die gespeichert werden; und sogar eine Zunahme der Größe einzelner
Dateneinheiten, wie beispielsweise Textverarbeitungsdokumentendateien, Videodateien
und so weiter. Diese gestiegene Bedarf hat seinerseits zu einem
größeren Bedarf
an Speicherplatz, und insbesondere an Speicherplatz, auf den "online" zugegriffen werden
kann, geführt.
-
Infolge
des wachsenden Bedarfs an Online-Speicherplatz stehen heute eine
Reihe von Optionen zur Verfügung,
mit denen dieser Bedarf befriedigt werden kann. Beispielsweise kann
zusätzliche
Hardware, wie beispielsweise Magnetspeichervorrichtungen ("Festplattenlaufwerke"), gekauft werden,
um die verfügbare
Menge des elektronisch zugreifbaren Speicherplatzes zu vergrößern. Jedoch
nimmt mit der zunehmenden Menge solcher Hardwarevorrichtungen auch
das Verwaltungsproblem im Hinblick auf die elektronische Verwaltung
dieser Vorrichtungen zu. Des Weiteren kann das bloße Vergrößern des Speicherplatzes
ebenso verschwenderisch wie unnötig
sein, da möglicherweise
nicht alle Daten erforderlich sind oder zumindest nicht für den unmittelbaren
Zugriff erforderlich sind.
-
Da
Problem kann teilweise dadurch gemindert werden, dass man eine Mischung
aus verschiedenen Arten von Speichereinrichtungen verwendet. Beispielsweise
meint "Online-Speicher" Speicherbereiche,
auf die direkt zugegriffen werden kann und die dauerhaft montiert
sind, wie beispielsweise magnetische (oder andere Arten von Speichermedien)
Plattenlaufwerke und Plattenanordnungen. Die Zeit, die für den Zugriff
auf diese Speicherbereiche erforderlich ist, wird in der Regel in
Sekundenbruchteilen gemessen. Da möglicherweise nicht alle Daten
in einem Online-Speicher gespeichert werden müssen – der schnell, aber auch teuer
ist –,
steht auch Nearline-Speicher zur Verfügung. Nearline-Speicher basiert
auf einem automatisch (maschinell) betriebenen Speicherbereich,
wie beispielsweise optischen Disks, die in einer Disk-"Jukebox" angeordnet sind, oder
Bändern
in einer automatischen Bandbibliothek. Solche automatisch betriebenen
Speichervorrichtungen sind in der Lage, eine relativ große Datenmenge mit
weniger physischen Lesevorrichtungen – oder Laufwerken – zum Lesen
der Daten zu speichern und automatisch darauf zuzugreifen. Diese
Speicherart ist kostengünstiger,
aber auch etwas langsamer beim Datenzugriff, dergestalt, dass die
Zugriffszeiten – je nach
der Verfügbarkeit
physischer Laufwerke zum Lesen der Speichermedien – in Sekunden
bis Minuten oder noch länger
gemessen werden. Online- oder Nearline-Speicher kann auch ein System
mit mehreren miteinander verbundenen physischen Laufwerken beinhalten,
beispielsweise ein LAN (Local Area Network) oder ein WAN (Wide Area
Network).
-
Offline-Speicher
ist die preisgünstigste
Art von Speicher, aber ist auch die langsamste beim Zugriff, weil
sie keinen automatischen elektronischen Zugriff gestattet. Statt
dessen ist die manuelle Bedienung der Speichervorrichtungen und
physischen Laufwerke durch einen menschlichen Bediener erforderlich.
Die Anzahl der physischen Laufwerke wird im Vergleich zur Anzahl
der Speichervorrichtungen (oder zumindest der Menge des verfügbaren Speicherplatzes)
deutlich verringert. Jedoch wird die Zeit des Zugriffs auf Daten
von solchen Vorrichtungen – je nach
der Verfügbarkeit
des menschlichen Bedieners und des Standortes der Speichervorrichtungen
sowie nach der Verfügbarkeit
der physischen Laufwerke – in
Minuten bis Stunden gemessen.
-
Es
können
auch andere Arten von Speichervorrichtungen und Funktionen zusätzlich zu
den – oder
als Ersatz für
die – oben
beschriebenen Vorrichtungen und Funktionen verwendet werden. In
jedem Fall besteht die Schwierigkeit bei einem gemischten System – oder einem
System, in dem verschiedene Arten von Speicherbereichen (Topologie)
verwendet werden – mit
verschiedenen Arten von Speichervorrichtungen und unterschiedlicher
Zugreifbarkeit (insbesondere im Hinblick auf die Zugriffszeit) in
der Verwaltung der Daten. Bestimmte Arten von Daten können wichtiger
sein, oder können
zumindest eine größere Kritikalität im Hinblick
auf die Zugriffszeit haben, so dass die Zugriffszeit für einige
Arten von Daten sehr wichtig sein kann und für andere Arten von Daten weit
weniger wichtig sein kann. Die Kosten sind ebenfalls ein wichtiger
Faktor. Außerdem
sind Entscheidungen hinsichtlich der Anzahl und der Art der einzukaufenden
Speichervorrichtungen sowie hinsichtlich eventueller erforderlicher
Unterstützungsvorrichtungen
und/oder einer eventuellen erforderlichen Systemunterstützung, wie
beispielsweise menschliche Bediener, zu treffen. Derzeit werden diese
Systeme manuell konstruiert und gebaut, und Entscheidungen werden
auf der Grundlage irgend einer Art von Vorschrift getroffen. Jedoch
ist der Betrieb des tatsächlichen
Systems und sogar die Konstruktion selbst möglicherweise für eine bestimmte
Organisation nicht optimal.
-
EP-A-0950965
betrifft ein Dokumentenspeicherungsverwaltungssystem und ein Dokumentenspeicherungsverwaltungsverfahren, womit
die Speicherung von Dokumenten anhand der Ähnlichkeit des Inhalts der
Dokumente verwaltet wird. Anhand der Ähnlichkeit des Inhalts der
Dokumente werden Dokumentengruppen erstellt. Die Speicherung der
ausgewählten
Gruppe oder des ausgewählten
Dokuments wird dann beispielsweise durch Löschen, Komprimieren oder Kopieren
verwaltet.
-
Die
Schrift von Hiroshi Ishikawa und Mitarbeitern mit dem Titel "A Document Warehouse;
A Multimedia Database Approach",
DEXA Workshop 1998, Seiten 90–94,
betrifft ein Dokumentenlager als ein Softwarerahmen, wo Multimediadokumente
so analysiert und verwaltet werden, dass Informationen unternehmensweit
gemeinsam verwendet und wiedergenutzt werden können, wie ein Datenlager für strukturierte
Daten. Es beschreibt einen Prototypen eines Dokumentenlagersystems,
das die Verwaltung einfacher und gebündelter Dokumente, stichwortgestützte und
inhaltsgestützte
Abrufe, regelbasierte Klassifizierung, SOM-gestütztes Clustern und Geschäftsregeln
unterstützt.
-
EP-A-0341230
betrifft ein Verfahren zum Verwalten von Daten in einer Datenspeicherungshierarchie
und eine Datenspeicherungshierarchie zur Implementierung eines solchen
Verfahrens. Die Datenspeicherungshierarchie beinhaltet einen Datenkatalog
und mehrere Datenspeicherungsebenen. Der Datenkatalog speichert
Informationen, die Datenverwaltungsregeln für die in der Hierarchie gespeicherten
Daten anzeigen. In der Hierarchie gespeicherten Daten werden markiert,
wenn ein Hostprozessor auf sie verweist. Die markierten Daten werden
entsprechend den Verwaltungsregeln während Zeiträumen geringer Hierarchieaktivität verwaltet.
-
US-A-5131087
betrifft eine Vorrichtung, die eine Anzahl von Datenbanken beinhaltet,
die von der Expertensystemsoftware zum Verwalten der Datenspeichervorrichtungen
des Computersystems verwendet werden. Ein Element, das in dieser
Vorrichtung vorhanden ist, ist ein Satz Datenspeichervorrichtungskonfigurationsdaten,
der die verschiedenen Datenspeichervorrichtungen und ihre Verbindung
in dem Computersystem beschreibt. Ein zweites Element ist eine Wissensdatenbank,
die einen Satz Funktionsregeln enthält, welche die Datenspeichervorrichtungsverwaltungsfunktion
beschreibt. Diese Regeln zeigen die Betriebskenndaten der verschiedenen
Datenspeichervorrichtungen an.
-
US-A-5506986
betrifft ein Speichermedienverwaltungssystem, das mit einem regelbasierten System
zur Verwaltung der Speichermedienzuweisungsfunktion für einen
Datenprozessor arbeitet. Diese Vorrichtung umfasst einen Satz Softwareprogramme,
die in Echtzeit mit verschiedenen standardmäßigen Softwarekomponenten in
dem Datenprozessor kommunizieren und außerdem Informationen abrufen,
die Daten beschreiben, welche in den Datenspeichervorrichtungen
selbst gespeichert sind, um Informationen zusammenzustellen, welche
die Datensatzaktivität
betreffen.
-
Kurzdarstellung
der Erfindung
-
Im
Stand der Technik wird keine Lösung
für das
Problem der effizienten Verwaltung einer Datenspeicherung gelehrt
oder vorgeschlagen. Im Stand der Technik wird auch keine Lösung für das Problem der
Verwaltung einer Datenspeicherung im Hinblick auf Kosteneffizienz
und brauchbare Zugriffszeiten gelehrt oder vorgeschlagen. Im Stand
der Technik wird auch keine Lösung
für das
Speichern von Daten entsprechend dem Inhalt der Daten bereitgestellt, dergestalt,
dass wichtige Daten an einem besser zugänglichen Ort oder in einer
besser zugänglichen
Art von Dateispeicher abgelegt werden können. Außerdem wird im Stand der Technik
kein System und kein Verfahren zum Verwalten von Daten gelehrt oder
vorgeschlagen, womit Daten entsprechend ihrem Inhalt korrekt gespeichert,
migriert und/oder gelöscht
werden.
-
Die
vorliegende Erfindung überwindet
diese Probleme des Standes der Technik, indem sie ein System und
ein Verfahren zur Datenverwaltung entsprechend dem Inhalt der Daten
bereitstellt. Die vorliegende Erfindung ermöglicht es; Daten in einer von mehreren
verschiedenen Speicheroptionen entsprechend wenigstens eines Merkmals
der Daten zu speichern, wobei das wenigstens eine Merkmal mit dem Inhalt
der Daten im Zusammenhang steht. Es ist zu beachten, dass wenigstens
eine Speicheroption gemäß der vorliegenden
Erfindung optional das Löschen
und/oder die Vernichtung von Daten ist, dergestalt, dass die Daten
optional von den Speichermedien entfernt werden können oder
optional gar nicht erst auf den Speichermedien gespeichert werden. Deshalb
beinhaltet ein "Speicherbetrieb" gemäß der vorliegenden
Erfindung jegliche Art von Speichermedien, -vorrichtungen, -systemen
oder Kombinationen daraus oder das Löschen (Entfernen) der Daten.
-
Optional
und besonders bevorzugt werden die Daten für ein Zeitintervall gemäß dem wenigstens einen
Merkmal der Daten gespeichert. Ganz besonders bevorzugt werden die
Daten zu einer anderen Art von Speicheroption verschoben, nachdem
ein Ereignis stattgefunden hat, beispielsweise nachdem das Zeitintervall
verstrichen ist. Es ist zu beachten, dass ein Verschieben oder Migrieren
der Daten auch das Löschen
oder Entfernen der Daten beinhalten kann.
-
Kurze Beschreibung der
Zeichnungen
-
Die
Erfindung wird im vorliegenden Text lediglich beispielhaft anhand
der begleitenden Zeichnungen beschrieben.
-
1 ist
ein schematisches Blockschaubild eines beispielhaften Systems und
Betriebsablaufs gemäß der vorliegenden
Erfindung.
-
2 ist
ein schematisches Blockschaubild eines weiteren beispielhaften Systems
und Betriebsablaufs gemäß der vorliegenden
Erfindung.
-
3 ist
ein schematisches Blockschaubild eine detaillierten beispielhaften
Systems gemäß der vorliegenden
Erfindung.
-
Beschreibung
der bevorzugten Ausführungsformen
-
Die
vorliegende Erfindung betrifft ein System und ein Verfahren zur
Datenverwaltung entsprechend dem Inhalt der Daten. Die vorliegende
Erfindung ermöglicht
es, Daten in einer von mehreren verschiedenen Speicheroptionen entsprechend
wenigstens eines Merkmals der Daten zu speichern, wobei das wenigstens
eine Merkmal mit dem Inhalt der Daten im Zusammenhang steht. Es
ist zu beachten, dass wenigstens eine Speicheroption gemäß der vorliegenden
Erfindung optional das Löschen
und/oder die Vernichtung der Daten ist, dergestalt, dass die Daten
optional von den Speichermedien entfernt werden können oder
optional gar nicht erst auf den Speichermedien gespeichert werden.
Optional und besonders bevorzugt werden die Daten für ein Zeitintervall
gemäß dem wenigstens
einen Merkmal der Daten gespeichert. Ganz besonders bevorzugt werden
die Daten zu einer anderen Art von Speicheroption verschoben, nachdem
ein Ereignis stattgefunden hat, beispielsweise nachdem das Zeitintervall
verstrichen ist. Es ist zu beachten, dass ein Verschieben oder Migrieren
der Daten auch das Löschen
oder Entfernen der Daten beinhalten kann.
-
Gemäß bevorzugten
Ausführungsformen
der vorliegenden Erfindung wird das wenigstens eine Merkmal der
Daten, gemäß dem die
Speicheroption ausgewählt
wird, durch eine Regel-Maschine
untersucht. Vorzugsweise vergleicht die Regel-Maschine das wenigstens eine Merkmal
der Daten mit wenigstens einer Regel und wählt dann die Speicheroption (oder
-optionen) gemäß dieser
Regel aus. Die Regel-Maschine fungiert daher vorzugsweise als ein
Filter zum Bestimmen, welche Speicheroption(en) für die untersuchten
Daten die geeignetste ist bzw. sind. Die Speicherentscheidung wird
dann vorzugsweise durch einen Speicherverwalter implementiert.
-
Die
Regeln, gemäß denen
die Regel-Maschine arbeitet, werden optional manuell durch einen menschlichen
Bediener eingegeben oder können
alternativ automatisch gemäß einer
zuvor festgelegten Geschäftsregel
oder gemäß einer
automatisch erzeugten Geschäftsregel
oder einer Kombination daraus generiert werden.
-
Vorzugsweise
arbeitet die vorliegende Erfindung mit einem System, das mehrere
verschiedene Speicheroptionen aufweist. Besonders bevorzugt beinhalten
diese verschiedenen Speicheroptionen wenigstens zwei verschiedene
Speicheroptionen mit verschiedenen Arten der Zugreifbarkeit. Zu
nicht-einschränkenden
Beispielen für
Speicheroptionen mit verschiedenen Arten der Zugreifbarkeit gehören beispielsweise
Online-Speicher, Nearline-Speicher und Offline-Speicher. Die Art
der Speichermedien, die für eine
bestimmte Speicheroption verwendet wird, wird durch die vorliegende
Erfindung nicht beschränkt,
da die vorliegende Erfindung mit jeder geeigneten Art von Speichermedien
arbeiten kann, beispielsweise DAT (bandgestützter Speicher), AIT (ebenfalls
ein bandgestützter
Speicher), magnetische Speichermedien, optische Disks, CD-ROM oder
eine Massenspeichervorrichtung von beliebiger Art oder eine beliebige
Art von Speichersystem oder jegliche Kombination daraus.
-
Das
wenigstens eine Merkmal der Daten, das mit dem Inhalt der Daten
im Zusammenhang steht, kann auf verschiedenen Wegen erhalten werden.
Beispielsweise können
die Daten optional und vorzugsweise zugehörige Metadaten aufweisen, die mit
dem Inhalt der Daten im Zusammenhang stehen. Die Metadaten werden
besonders bevorzugt durch eine Annotation der Daten selbst hinzugefügt. Eine solche
Annotation erfolgt automatisch, Besonders bevorzugt erfolgt die
automatische Annotation nach der automatischen Analyse der Daten.
Die zugehörigen
Metadaten werden dann vorzugsweise verwendet, um zu bestimmen, welche
Speicheroption für
die Daten verwendet werden soll, und besonders bevorzugt, um auch
das Zeitintervall zu bestimmen, während dem die Daten in dieser
Speicheroption abgelegt werden sollen.
-
Wie
zuvor beschrieben, werden die Daten besonders bevorzugt gemäß wenigstens
einem Merkmal der Daten durch eine Regel-Maschine gefiltert. Für die Implementierung
der vorliegenden Erfindung mit Metadaten wird der Filterungsprozess
besonders bevorzugt gemäß den zugehörigen Metadaten
durchgeführt.
-
Eine
automatische Analyse der Daten wird besonders bevorzugt gemäß der Art
der analysierten Daten durchgeführt.
Zu nicht-einschränkenden
Beispielen für
verschiedene Arten von automatischen Analyseprozessen, die optional
durchgeführt
werden können,
gehören
Sprache-zu-Text-Umwandlung
für Sprachkommunikationsdaten,
ein Videoanalysator für
Videodaten, OCR (optische Zeichenerkennung) für Drucksachen, die elektronisch
gescannt wurden, Bildanalyse für
Bilddaten, Textanalyse für
Textdaten sowie Analysatoren für Benutzerschnittstellendaten. Diese
verschiedenen Arten von Datenanalyseprozessen werden vorzugsweise
gemäß der Quelle
der Daten durchgeführt,
bei der es sich optional um eine beliebige geeignete Datenquelle
handeln kann. Zu nicht-einschränkenden
Beispielen für
verschiedenen Arten von Datenquellen gehören Videodaten, Audiodaten
(darunter auch Sprachkommunikationsdaten wie beispielsweise Voiceover-IP
(VOIP)-Daten, Streaming-Audiodaten und jede sonstige Art von audiobezogenen
Daten), codierte Daten, E-Mail-Nachrichten
und/oder -Anhänge,
Chat- und sonstige Arten von Nachrichtenübermittlungssystemmeldungen,
Dokumente, die per Fax übertragen
werden, und Benutzerschnittstellendaten.
-
Darüber hinaus
eignet sich die vorliegende Erfindung zur Erfassung von Daten über im Wesentlichen
jede Art von Benutzerschnittstellenfunktion. Zu nicht-einschränkenden
Beispielen für
solche Benutzerschnittstellenfunktionen gehören jegliche Arten von GUI-Fensteraktivitäten; Aktivitäten mit
GUI-Bedienelementen wie beispielsweise Schaltflächen, Schiebern oder sonstige
Funktionen, die durch ein GUI-Fenster angeboten werden; die Anzeige
eines Bildes und/oder Textes, beispielsweise Web-Seiten und/oder
deren Komponenten; Informationen, die über eine akustische Schnittstelle
ausgegeben werden, wie beispielsweise eine synthetische Stimme; Informationen,
die über
die Anzeige von Videodaten ausgegeben werden; und jegliche Art von
Informationen, die über
das Betriebssystem des Benutzerrechners ausgegeben werden oder auf
sonstige Weise durch das Betriebssystem des Benutzerrechners erkannt
werden können.
-
Gemäß bevorzugten
Ausführungsformen
der vorliegenden Erfindung werden die Daten vorzugsweise von einer
ersten Speicheroption zu einer zweiten, anderen Speicheroption migriert
oder verschoben, nachdem ein Zeitintervall verstrichen ist. Das Zeitintervall
wird vorzugsweise gemäß den Metadaten
bestimmt.
-
Die
Prinzipien und die Funktionsweise des Verfahren gemäß der vorliegenden
Erfindung können anhand
der Zeichnungen und der begleitenden Beschreibung besser verstanden
werden.
-
Wenden
wir uns nun den Zeichnungen zu. 1 zeigt
ein erstes beispielhaftes System 10 zum Verwalten von Daten
entsprechend dem Inhalt der Daten im Hinblick auf den Betriebsablauf
des Systems 10. Wie gezeigt, enthält das System 10 wenigstens
eine Eingabedatenquelle 12. Zu nicht-einschränkenden Beispielen für verschiedenen
Arten von Eingabedatenquellen 12 gehören Videodaten, Audiodaten
(darunter auch Sprachkommunikationsdaten wie beispielsweise Voiceover-IP
(VOIP)-Daten, Streaming-Audiodaten und jede sonstige Art von audiobezogenen
Daten), codierte Daten, E-Mail-Nachrichten
und/oder -Anhänge,
Chat- und sonstige Arten von Nachrichtenübermittlungssystemmeldungen,
Dokumente, die per Fax übertragen
werden, und Benutzerschnittstellendaten. Im Hinblick auf Benutzerschnittstellendaten,
wobei die Aktion eines Nutzers beim Bedienen eines Rechners und/oder
eines Peripheriegerätes
und/oder eines zugehörigen Eingabegerätes das
Erzeugen der Daten bewirkt, haben die Daten optional und vorzugsweise
die Form eines Ereignisses. Jede Aktion des Nutzers bewirkt vorzugsweise
die Generierung eines Ereignisses. Das Ereignis kann dann optional
die Daten bilden, die erfasst werden sollen.
-
Die
erfassten Daten werden an einen Formatanalysator 14 geleitet,
um sie zur Analyse in ein gemeinsames Format zu bringen. Der Formatanalysator 14 enthält vorzugsweise
mehrere Formatmodule 16, von denen jedes für Daten
einer anderen Formatart geeignet ist. Wenn es sich beispielsweise
bei den Eingabedaten um Sprachkommunikationsdaten handelt, so wandelt
vorzugsweise ein Formatmodul 16 die Sprachkommunikation
in Textdaten für
eine Sprache-zu-Text-Umwandlung
um. verschiedene Formatmodule 16 handhaben vorzugsweise
verschiedene Arten von Eingabedaten, wie weiter unten im Zusammenhang
mit 3 näher
erläutert
wird.
-
Gemäß einer
bevorzugten Ausführungsform der
vorliegenden Erfindung handelt es sich bei dem gemeinsamen Datenformat
optional und vorzugsweise um Textdaten. Bei dieser bevorzugten Ausführungsform
werden die Textdaten optional nicht durch ein Formatmodul 16 weiterverarbeitet
oder werden alternativ nur minimal verarbeitet. Andere Arten von Daten
in anderen Datenformaten werden dann vorzugsweise durch das Formatmodul 16 in
Textdaten umgewandelt, wie unten im Zusammenhang mit 3 beschrieben
wird.
-
Als
nächstes
analysiert vorzugsweise ein Analysemodul 18 die Daten,
sobald die Daten das gemeinsame Format haben. Es ist zu beachten,
dass optional das Analysemodul 18 in der Lage ist, mehrere
verschiedene Datenformate über
ein einziges Modul oder alternativ über eine (nicht gezeigte) Gruppe solcher
Module zu verarbeiten. Vorzugsweise verarbeitet das Analysemodul 18 mehrere
verschiedene Arten und/oder Quellen von Daten gleichzeitig, beispielsweise
als eine nebenläufige
Anwendung. In dem nicht-einschränkenden
veranschaulichenden Beispiel, das oben beschrieben wurde, werden
Textdaten analysiert, wie dem Fachmann allgemein bekannt ist. Ein
nicht-einschränkendes
Beispiel einer Textanalysesoftware ist das IntelligentminerTM-Produkt (IBM Corp., für weitere Details siehe http-//www-4.ibm.com/software/data/iminer/fortext/tatools.html
mit Stand vom 31. Dezember 2001). Dieses Produkt eignet sich bei
der Analyse von Text für
eine Anzahl von Funktionen, wie beispielsweise das Auffinden von
Informationen zu einem Thema, das Kategorisieren von Informationen und
das Klassifizieren von Informationen. Textanalyse-Tools kennt der
Fachmann allgemein zum Extrahieren von Inhalten und/oder Informationen
im Zusammenhang mit dem Themengegenstand eines Textes, beispielsweise
gemäß einem oder
mehreren Stichwörtern,
Konzepten oder sonstigen Arten von Organisations- und/oder Analyseregimes.
-
Gemäß einer
anderen bevorzugten Ausführungsform
der vorliegenden Erfindung beinhaltet das einheitliche Format eine
einheitliche Datenstruktur mit mehreren verschiedenen Arten und/oder
Kategorien von Informationen, beispielsweise Daten von Suchereignissen
und Sprachdaten in Kombination mit einer einzelnen Datei. Diese
einheitliche Datenstruktur ist vorzugsweise in der Lage, die verschiedenen Arten
oder Kategorien von Merkmalen zu enthalten, die von Interesse sind,
um den Daten zugeordnet zu werden, um den Inhalt der erfassten Daten
zu bestimmen. Zu nicht-einschränkenden
Beispielen für eine
einheitliche Datenstruktur, die optional gemäß der vorliegenden Erfindung
implementiert werden kann, gehören
Strukturen, die XML (Extensible Markup Language) oder ASF (Advanced
Streaming Format, von der Microsoft Corp., USA) verwenden.
-
Das
Analysemodul 18 extrahiert und/oder erzeugt – oder bestimmt
auf sonstige Weise – vorzugsweise
wenigstens ein Merkmal der erfassten Daten, das vorzugsweise in
dem einheitlichen Format erhalten wird. Optional und besonders bevorzugt
erhält das
Analysemodul 18 das wenigstens eine Merkmal der erfassten
Daten in Form von Metadaten. Diese Metadaten werden dann optional
in einer Metadaten-Datenbank (nicht gezeigt, siehe 3)
gespeichert.
-
Gemäß einer
optionalen, aber bevorzugten Ausführungsform der vorliegenden
Erfindung gibt das Analysemodul 18 auch eine Rückmeldung
zum Verbessern der Leistung des Formatanalysators 14 und/oder
des Formatmoduls 16, um den Betrieb dieser Komponenten
zu optimieren.
-
Die
erfassten Daten, mit dem wenigstens einen Merkmal, das mit dem Inhalt
der Daten im Zusammenhang steht und das optional und besonders bevorzugt
in Form von Metadaten vorliegt, werden dann zu einer Regel-Maschine 20 geleitet.
Alternativ empfängt
die Regel-Maschine 20 lediglich das wenigstens eine Merkmal,
besonders bevorzugt in Form von Metadaten. Die erfassten Daten werden
dann direkt zu einem Speicherverwalter 22 geleitet. Die
Regel-Maschine 20 vergleicht besonders bevorzugt die Metadaten
mit wenigstens einer Regel, bei der es sich ganz besonders bevorzugt
um eine Geschäftsregel
handelt, die durch einen manuellen menschlichen Nutzer vorgegeben
wurde, oder die alternativ optional automatisch gemäß einer
zuvor festgelegten Geschäftsregel
oder gemäß einer
automatisch erzeugten Geschäftsregel – oder einer
Kombination daraus – erzeugt
werden kann. Optional können
eine oder mehrere Regeln der Regel-Maschine 20 über eine
Schnittstelle 24, wie beispielsweise eine GUI (Graphical
User Interface – graphische
Benutzerschnittstelle), zugeleitet werden. Als ein nicht-einschränkendes
Beispiel kann die Schnittstelle 24 optional eine einfache
Webbrowser-gestützte
Schnittstelle sein. Die Regel-Maschine 20 bestimmt dann vorzugsweise
die Art der Speicheroption (oder -optionen) gemäß einer oder mehreren Regeln,
die durch den Vergleich der Metadaten (oder des Merkmals) der erfassten
Daten mit der oder den Regeln ausgewählt wurden. Zusätzlich oder
alternativ wird das Ausgabe-Ergebnis der Regel-Maschine 20 optional und
vorzugsweise an den Formatanalysator 14 und/oder das Formatmodul 16 und/oder
das Analysemodul 18 zurückgemeldet.
-
Die
Regel-Maschine 20 bestimmt optional und besonders bevorzugt
sowohl die Art der Speicheroption (oder -optionen), die für die konkreten
erfassten Daten auszuwählen
ist, als auch die Dauer der Speicherung. Ganz besonders bevorzugt
werden die erfassten Daten anfänglich
mit einer ersten Speicheroption gespeichert und dann zu wenigstens
einer zusätzlichen
Speicheroption migriert (verschoben), nachdem ein Zeitraum verstrichen
ist. Dieser Zeitraum wird ebenfalls ganz besonders bevorzugt gemäß wenigstens
einer Regel durch die Regel-Maschine 20 bestimmt.
-
Die
Regel-Maschine 20 kann optional eine Aktion gemäß einer
Regel und/oder eines Ereignisses ausführen, wobei das Ereignis optional
und vorzugsweise die automatische Anwendung der Regel auslösen kann.
Beispiele für
Aktionen auf der Grundlage von Regeln sind unten angeführt. Ein
nicht-einschränkendes
Beispiel für
Aktionen, die auf Regeln basieren, sind Bearbeitungen von gespeicherten
Daten. Beispielsweise kann die Komprimierung der Daten optional
geändert
werden, nachdem ein Ereignis stattgefunden hat, wie beispielsweise
das Verstreichen eines Zeitraums. Ein nicht-einschränkendes Beispiel
für einen
Grund zum Ändern
einer solchen Komprimierung ist es, eine raschere Wiedergabe der Daten
zu ermöglichen.
-
Zuvor
gespeicherte Daten können
optional und vorzugsweise mit Geschäftsdaten aktualisiert werden.
Zu nicht-einschränkenden
Beispielen für
solche Daten gehören
die Hinzufügung
der Sozialversicherungs- oder Kennnummer, eines Kundenschlüssels, von
Vorzugskundenstatusinformationen und so weiter.
-
Aktuelle
Transaktionsdaten können
ebenfalls optional und vorzugsweise mit der zuvor gespeicherten
Datei verknüpft
werden. Zuvor gespeicherte Daten können auch optional aktualisiert
werden. Ein nicht-einschränkendes
Beispiel einer solchen Verknüpfung
kann optional durch Verknüpfen
von Transaktionen, die durch einen bestimmten Kunden mit hohem Status
oder Vorzugskunden ausgeführt
wurden, mit früheren
Transaktionen dieses Kunden ausgeführt werden.
-
Ein
anderes Beispiel eines Ereignisses oder einer Aktion kann optional
mit dem mehrfachen Spiegeln von Daten ausgeführt werden, beispielsweise durch
Verteilen von identischen Daten an verschiedene Zielorte und/oder
zuvor festgelegte Speicherorte und/oder Speicheroptionen. Ein solches
Spiegeln kann optional aus Redundanzgründen, beispielsweise im Interesse
der Sicherheit der gespeicherten Daten, durch Duplizieren an mehrere
Speicherorte oder -optionen und/oder aus Gründen der allgemeinen Verfügbarkeit
durchgeführt
werden.
-
Der
Speicherverwalter 22 empfängt vorzugsweise dann das Ausgabe-Ergebnis
der Regel-Maschine 20 und der erfassten Daten. Das Ausgabe-Ergebnis
der Regel-Maschine 20 enthält vorzugsweise wenigstens
eine Speicheroption für
die erfassten Daten. Wie zuvor angemerkt, könnte diese Speicheroption eine
Art von Speichermedium oder das Löschen und/oder Entfernen und/oder
die Vernichtung der erfassten Daten sein. Besonders bevorzugt enthält die Speicheroption
eine konkrete Speichervorrichtung 26, in der die erfassten
Daten abzulegen sind. Alternativ könnte der Speicherverwalter 22 die
Identität der
konkreten Speichervorrichtung 26 zum Speichern der Daten
festlegen.
-
2 zeigt
einen anderen Ablaufanordnung für
das System von 1 als ein weiteres Beispiel
eines Systems gemäß der vorliegenden
Erfindung. Bei dieser Anordnung enthält das System 10 auch
wieder eine Regel-Maschine 40. Jedoch ist bei dieser Implementierung
die Regel-Maschine 40 der Initiierungsprozess oder die
Initiierungskomponente für
anschließende
Aktionen, die von dem System 10 durchgeführt werden.
Wie gezeigt, wählt
die Regel-Maschine 40 die Eingabequelle gemäß den Metadaten, die
von einem Analysemodul 38 erhalten wurden. Die Regel-Maschine 40 sendet
dann vorzugsweise die erfassten Daten, oder alternativ nur ausgewählte erfassten
Daten, zu einem Speicherverwalter 42. Der Speicherverwalter 42 sendet
die erfassten Daten an die richtige Speicheroption, die vorzugsweise
als eine ausgewählte
Speichervorrichtung 44 gezeigt ist, gemäß einer Anforderung für eine Aktion
durch die Regel-Maschine 40. Optional und besonders bevorzugt, und
erforderlichenfalls ganz besonders bevorzugt, meldet die Regel-Maschine 40 die
erfassten Daten – und/oder
Informationen über
die erfassten Daten – an
die Eingabequellen zurück.
Optimierte Metadaten können
optional vom Analysemodul 38 erhalten werden.
-
Gemäß einer
optionalen Implementierung der vorliegenden Erfindung definiert
der Nutzer eine Aufgabe in der Regel-Maschine 40 zum Archivieren bestimmter
Arten von Informationen, wie beispielsweise Informationen über bestimmte
Telefonate. Die Regel-Maschine 40 verwendet dann vorzugsweise das
Analysemodul 38 zum Auswählen bestimmter Daten. Das
Analysemodul 38 kann optional beispielsweise als ein Anrufverwaltungsserver
implementiert sein. Bei den ausgewählten bestimmten Daten kann
es sich optional um Sprachdaten und/oder um Daten, die von Benutzerschnittstellenaktionen
erfasst wurden, und/oder um Videodaten und/oder um eine E-Mail-Transaktion
und/oder um Faxdaten und/oder um VoIP und/oder um Web-Cobrowsing-Daten
(die von zwei oder mehr Nutzern erhalten wurden, die die gleiche
oder die gleichen Web-Seiten über
verschiedenen Webbrowser-Prozesse betrachten) oder um jegliche codierten
Daten oder jegliche Kombination jeglicher Art von Eingabequellen
handeln. Die Daten werden von Eingabequellen 36 erhalten,
die optional als ein Eingangsquellen-Logger implementiert sein können. Die
erfassten Daten werden dann in einen Speicherverwalter 42 übertragen.
-
Diese
Daten können
optional nach Bedarf aus den Speichervorrichtungen 44 abgerufen
werden, besonders bevorzugt direkt unter Verwendung der Regel-Maschine 40 und/oder
des Speicherverwalters 42. Diese abgerufenen Daten können dann optional
und besonders bevorzugt in die Eingabequellen 36 eingespeist
werden, damit auf die abgerufenen Daten weithin zugegriffen werden
kann (d. h. damit sie weithin verfügbar sind), und/oder um weiter bearbeitet
zu werden.
-
3 zeigt
eine beispielhafte detaillierte Implementierung eines Systems gemäß der vorliegenden
Erfindung, die sich auf den in 1 gezeigten Betriebsablauf
bezieht. Wie gezeigt, enthält
ein System 50 vorzugsweise mehrere Eingabedatenquellen 52.
Lediglich zum Zweck der Erläuterung
und ohne Absicht der Einschränkung
gehören
zu den Eingabedatenquellen 52 in dieser Darstellung optional
und vorzugsweise eine Videoquelle 54 für Videodaten, eine Audioquelle 56 für Audiodaten,
ein Nachrichtenübermittlungsquelle 58 für E-Mail-Nachrichten
(einschließlich
Anhängen),
Sofort-Nachrichtenübermittlung
und/oder Chat-Daten und eine Fax-Quelle 60 für Daten,
die per Fax übertragen
werden.
-
Die
Eingabedaten von den Eingabedatenquellen 52 werden dann
vorzugsweise in wenigstens einen Formatanalysator 62 zum
Umwandeln der erfassten Daten in ein gemeinsames Format zur Analyse
eingespeist. Der Formatanalysator 62 enthält vorzugsweise
mehrere Formatmodule 74, von denen jedes für Daten
einer anderen Formatart geeignet ist. Lediglich zu Veranschaulichungszwecken
und ohne Absicht der Einschränkung
gehören
zu den Formatmodulen 74 in dieser Darstellung optional
und vorzugsweise ein Videoanalysator 76, ein Textanalysator 78,
ein Audioanalysator 79 und ein OCR-Modul (Optische Zeichenerkennung) 80.
-
Ein
Beispiel des Textanalysators 78 wurde zuvor in Verbindung
mit 1 beschrieben. Das OCR-Modul 80 kann
optional so implementiert werden, wie es im Stand der Technik allgemein
bekannt ist, beispielsweise durch Verwendung einer OCR-Software
mit einem Algorithmus, der durch einen Durchschnittsfachmann ohne
Weiteres ausgewählt
werden könnte.
-
Die
Videoanalyse kann optional wie folgt durch den Videoanalysator 76 durchgeführt werden. Die
Videodaten werden beispielsweise von einer Kamera als ein nicht-einschränkendes
Beispiel einer Videoquelle 54 erhalten. Dass wird vorzugsweise
ein Framegrabber verwendet, um wenigstens einen Frame der Videodaten
zu erhalten. Der Frame wird, vorzugsweise analysiert. Besonders
bevorzugt wird nur ein Teil des Frames als erfasste Daten gespeichert. Wenn
beispielsweise eine Videokamera zur Überwachung eines Eingangs zu
einem Sicherheitsbereich verwendet wird, so sind optional nur jene
Frames, oder alternativ jene Teile eines jedes Frames, die eine
Person nahe dem Eingang zeigen, von Interesse. Zusätzlich oder
alternativ können Änderungen
im Hintergrund eines jeden Frame optional erkannt und verfolgt werden,
sofern sie von Interesse sind.
-
Ein
Beispiel einer Art von Analyse, der die Videodaten unterzogen werden
können,
ist ein Bewegungserkennungsalgorithmus, wie er im Stand der Technik
allgemein bekannt ist. Ein weiteres Beispiel sind Gesichtserkennungsalgorithmen,
wie sie ebenfalls im Stand der Technik allgemein bekannt sind. Nicht-einschränkende Beispiele
für Videoanalysealgorithmen
sind unter http://www.cs.rochester.edu/u/nelson/research/motion/motion.html
mit Stand vom 31. Dezember 2001 für Bewegungserkennungsalgorithmen
und unter http://www.white.media.mit.edu/vismod/demos/facerec mit
Stand vom 31. Dezember 2001 für
Gesichtserkennungsalgorithmen beschrieben. Besonders bevorzugt erfolgen
solche Analysen mit Firmware, wie beispielsweise einem DSP (Digitaler
Signalprozessor). Die Ergebnisse können dann optional als die
erfassten Daten gespeichert werden.
-
Das
Ausgabe-Ergebnis des Formatanalysators 62 enthält vorzugsweise
wenigstens ein Merkmal der erfassten Daten, bei denen es sich besonders
bevorzugt um Metadaten handelt, wie zuvor beschrieben. Die Metadaten
werden besonders bevorzugt in einer Metadaten-Datenbank 82 gespeichert. Eine
Regel-Maschine 84 analysiert dann vorzugsweise die Metadaten
aus der Metadaten-Datenbank 82 (oder die alternativ direkt
vom Formatanalysator 62 erhalten wurden), um eine oder
mehrere Regeln auf die erfassten Daten anzuwenden. Die Regel-Maschine 84 kann
optional mit dem BlazeSoftware Advisor-Produkt von Blaze Software
implementiert werden (Details siehe http://www.blazesoft.com/products mit
Stand vom 31. Dezember 2001). Die Regel-Maschine 84 kann
optional auch als eine Regel-/Aufgabenmaschine von Nice Systems
Ltd. (Ra'anana,
Israel), beispielsweise auf der Grundlage von Geschäftsdaten,
implementiert werden. Unabhängig
von der konkreten Implementierung arbeitet die Regel-Maschine 84 vorzugsweise
entsprechend wenigstens einer Geschäftsregel.
-
Die
Regel-Maschine 84 vergleicht vorzugsweise das wenigstens
eine Merkmal der Daten mit wenigstens einer Regel und wählt dann
die Speicheroption (oder -optionen) gemäß dieser Regel aus. Die Regel-Maschine 84 kann
daher besonders bevorzugt als ein Filter arbeiten, um zu bestimmen,
welche Speicheroption(en) für
die untersuchten Daten die geeignetsten sind. Die Speicherentscheidung
wird dann vorzugsweise durch einen Speicherverwalter 86 implementiert.
-
Vorzugsweise
ist der Speicherverwalter 86 in der Lage, aus mehreren
verschiedenen Speicheroptionen auszuwählen. Besonders bevorzugt beinhalten
diese verschiedenen Speicheroptionen wenigstens zwei verschiedene
Speicheroptionen mit verschiedenen Arten von Zugreifbarkeit. Zu
nicht-einschränkenden
Beispielen für
Speicheroptionen mit verschiedenen Arten von Zugreifbarkeit gehören Online-Speicher,
Nearline-Speicher und Offline-Speicher.
Die Art von Speichermedien, die für eine konkrete Speicheroption
verwendet wird, ist nicht gemäß der vorliegenden
Erfindung beschränkt.
Lediglich zu Veranschaulichungszwecken und ohne Absicht der Einschränkung ist
der Speicherverwalter 86 in dieser Darstellung in der Lage,
aus mehreren Speichervorrichtungen, die als eine Online-Speichervorrichtung 88 und
eine Offline-Speichervorrichtung 90 gezeigt sind, eine
Auswahl zu treffen. Natürlich
können
auch andere Arten von Speichervorrichtungen und/oder – systemen
anstelle von – oder
zusätzlich
zu – diesen Beispielen
für Speichervorrichtungen
verwendet werden.
-
Die
Regel-Maschine 84 ist optional und vorzugsweise in der
Lage, Informationen an den Formatanalysator 62 zurückzumelden,
um die Leistung des Formatanalysators 62 zu optimieren.
-
Ein
nicht-einschränkendes
Beispiel des Betriebes des Systems 50 kann folgendermaßen ausgeführt werden.
Das System 50 könnte
optional in einem Service-Zentrum implementiert werden, das Diensteanforderungen
von Kunden räumlich
abgesetzt verarbeitet, dergestalt, dass der Kunde nicht selbst in
dem Service-Zentrum anwesend ist. Der Kunde kontaktiert somit das
Personal des Service-Zentrums, beispielsweise über Sprachkommunikation (wie
beispielsweise ein Telefonat), E-Mail-Nachrichten, Faxe und so weiter.
Mehrere Geschäftsregeln
wurden durch die Regel-Maschine definiert und implementiert, die
optional die folgenden Regeln beinhalten könnten: ein Datensatz wird für jeden
Kundenkontakt geführt,
der für
wenigstens drei Monate auf eine Finanztransaktion verweist, selbst
wenn es zu keiner Transaktion gekommen ist, und wird für jeden
Kontakt, bei dem es zu einer Finanztransaktion kam, wenigstens sieben
Jahre lang aufbewahrt. Außerdem
wird der Datensatz für
jeden Kontakt, der zu einer tatsächlichen
Finanztransaktion führte,
einen Monat lang zuerst im Online-Speicher gespeichert und dann
in einem Offline-Speicher für den
Rest der Dauer von sieben Jahren gespeichert.
-
Sobald
der Kunde einen Mitarbeiter des Service-Centers kontaktiert hat,
beispielsweise über
das Telefon, werden Daten über
eine Audioquelle 56 (als ein Beispiel einer Eingabequelle 52) übermittelt.
Diese erfassten Audiodaten werden analysiert, beispielsweise um
zu bestimmen, ob es während
des Kontakts zu der Finanztransaktion kam. Wenn es zu einer solchen
Transaktion kam, dann zeigen die Metadaten, die zu den erfassten
Audiodaten gehören, ein
solches Ereignis an. Der Formatanalysator 62, und insbesondere
der Audioanalysator 79, analysiert vorzugsweise die erfassten
Audiodaten, um diese Metadaten zu erhalten.
-
Die
Daten von dem Anruf selbst werden vorzugsweise gemäß einer
oder mehreren Geschäftsregeln,
die optional manuell definiert und/oder automatisch erzeugt werden
können,
mittels der Funktion der Regel-Maschine 84 gehandhabt.
Vorzugsweise erzeugt die Regel-Maschine 84 dann eine Aktion,
die von dem Speicherverwalter 86 ausgeführt werden soll. Beispielsweise
kann der Speicherverwalter 86 optional die Daten des Anrufs
speichern, die Daten zu einer neuen Art von Speicher migrieren oder
die Daten löschen,
oder eine sonstige Aktion oder eine Kombination von Aktionen, die
gemäß einem
oder mehreren Ereignissen ausgeführt
werden. Die Regel-Maschine 84 ist somit in der Lage, eine
oder mehrere Anweisungen zur Ausführung durch den Speicherverwalter 86 zu
erzeugen.
-
Obgleich
die Erfindung bezüglich
einer begrenzten Anzahl von Ausführungsformen
beschrieben wurde, versteht es sich, dass viele Variationen, Modifikationen
und andere Anwendungen der Erfindung vorgenommen werden können, die
in den Geltungsbereich der angehängten
Ansprüche
fallen.