DE69533054T2 - Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften - Google Patents

Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften Download PDF

Info

Publication number
DE69533054T2
DE69533054T2 DE69533054T DE69533054T DE69533054T2 DE 69533054 T2 DE69533054 T2 DE 69533054T2 DE 69533054 T DE69533054 T DE 69533054T DE 69533054 T DE69533054 T DE 69533054T DE 69533054 T2 DE69533054 T2 DE 69533054T2
Authority
DE
Germany
Prior art keywords
pixel
value
image
input
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69533054T
Other languages
English (en)
Other versions
DE69533054D1 (de
Inventor
Yongchun Rochester Lee
Joseph M. Rochester Basile
Peter Rochester Rudak
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Application granted granted Critical
Publication of DE69533054D1 publication Critical patent/DE69533054D1/de
Publication of DE69533054T2 publication Critical patent/DE69533054T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

  • Die vorliegende Erfindung betrifft eine Technik und insbesondere eine Vorrichtung sowie ein zugehöriges Verfahren zur Schwellenwertverarbeitung eines Bildes anhand lokaler Bildeigenschaften, insbesondere Leuchtdichte- oder Luminanzschwankungen, und insbesondere eines, das eine Mehrfenstertechnik zur Erzeugung einer Störfestigkeit gegen Rauschen und weniger Grenzartefakte nutzt.
  • Mit zunehmender Verbreitung der digitalen Bildverarbeitung und der digitalen Kommunikation wird eine zunehmende Anzahl gedruckter oder anderer Textdokumente für die nachfolgende computergestützte Verarbeitung und/oder digitale Übertragung gescannt. Die Verarbeitung kann beispielsweise eine optische Zeichenerkennung zur Umwandlung gedruckter Zeichen, sei es maschinenschriftlicher oder handschriftlicher Zeichen, aus der gescannten Bit-Map-Form in einen entsprechenden Zeichensatz, wie ASCII, umfassen, wobei der letztere zur Verwendung in einer Textverarbeitung und ähnlichen computergestützten Dokumentverarbeitungsaufgaben besser geeignet ist.
  • Durch Scannen eines Graustufendokuments wird normalerweise ein Mehrbitwert, typischerweise ein 8-Bitwert, für jedes Pixel in dem gescannten Dokument erzeugt. Dieser Wert stellt die Leuchtdichte oder Luminanz in Bezug auf 256 Graustufen eines Pixels an einem entsprechenden Punkt in dem Dokument dar. Diese Pixel werden abhängig von der Auflösung des Scanners häufig mit Auflösungen von 200–400 Pixel/Zoll(ca. 80–160 Pixels/cm) erzeugt, wobei sehr detaillierte Bilder auch mit über 1200 oder mehr Pixel/Zoll(ca. 470 Pixel/cm) erzeugt werden. Demnach enthält ein gescanntes Bild im Format 8 1/2 mal 11 Zoll(ca. 22 mal 28 cm) eine beträchtliche Menge von Graustufendaten. Insofern als dass gescannter Text im Allgemeinen ein geschriebenes oder gedrucktes Zeichen vor einem kontrastierenden, farbigen Hintergrund darstellt, normalerweise ein weißes oder schwarzes Zeichen vor einem weißen oder hellen Hintergrund oder umgekehrt, ist der genaue Luminanzwert eines Pixels im Text nicht so wichtig wie die Frage, ob das Pixel Teil des Zeichens oder des Hintergrunds ist. Gescannte Textbilder oder gescannte Textteile von größeren Bildern, die sowohl Text als auch Grafik enthalten, sind daher effizient durch Ein-Bit-Pixel darstellbar, in denen jedes Pixel in einem gescannten Bild einfach auf z.B. "eins" gesetzt wird, soweit das Pixel in dem Originalbild Teil eines Zeichens oder Teil der Vordergrundinformation ist, oder auf z.B. "null", sofern das Pixel in dem Originalbild Teil des Bildhintergrunds ist. Um die verschiedenen Arten gescannter Bilder einfach unterscheiden zu können, ist ein Graustufenbild als ein Bild definiert, das Mehrbit-Pixel (also mehrwertige Pixel) enthält, während ein binäres (oder zweiwertiges) Bild aus Ein-Bit-Pixeln gebildet ist. Da binäre Bilder wesentlich weniger Daten für ein gegebenes Textbild erzeugen, beispielsweise 1/8 der Datenmenge einer 8-Bit-Graustufenwiedergabe desselben Bildes, sind binäre Bilder gegenüber entsprechenden Graustufenbildern viel effizienter und werden daher zur Speicherung und Weitergabe von Textbildern bevorzugt. Binäre Bilder werden zudem bevorzugt, wie sie einfach mit Standardkompressionstechniken komprimierbar sind, z.B. nach dem Kompressionsstandard gemäß CCIT Gruppe 3 oder 4.
  • Graustufenbilder werden durch eine so genannte Schwellenverarbeitung in binäre Bilder umgewandelt. Im Wesentlichen wird jeder Mehrbit-Pixelwert in einem gescannten Graustufenbild mit einem vorbestimmten Schwellenwert verglichen, der fest, veränderlich oder adaptiv veränderlich sein kann, um ein einzelnes, entsprechendes Ausgabebit zu erzeugen. Wenn der Mehrbit-Pixelwert dem Schwellenwert für das jeweilige Pixel entspricht oder diesen überschreitet, wird das resultierende Einbit-Ausgabepixel auf "eins" gesetzt; wenn der Schwellenwert größer als das Mehrbit-Pixel ist, bleibt das resultierende Einbit-Ausgabepixel auf "null". Auf diese Weise werden durch die Schwellenwertverarbeitung die Pixel, die Zeichen oder andere gewünschte Objekte bilden, von dem Hintergrund in einem gescannten Graustufenbild extrahiert, wobei die Pixel, die jedes Zeichen oder jedes Objekt bilden, einen Wert aufweisen, typischerweise den Wert für schwarz, während die Pixel für den Hintergrund alle einen anderen Wert aufweisen, typischerweise den Wert für weiß. Zum besseren Verständnis bezeichnet die nachfolgende Beschreibung jedes Zeichen oder jedes gewünschte Objekt in dem Bild einfach als ein "Objekt".
  • Idealerweise ist der beste Schwellenwertprozess derjenige, der in dem gescannten Bild alle Objektpixel – und nur diese – genau auswählt und auf einen gemeinsamen Einbit-Wert abbil det, wie beispielsweise "eins" für schwarz. In der Praxis schließen Rauschen, Hintergrundschattierungen, ungleichmäßiges Licht in einem Scanvorgang und andere derartige Phänomene die Verwendung eines einzelnen, festen Schwellenwerts für ein gesamtes Bild aus. Wenn der Schwellenwert zu niedrig ist, kann das resultierende Bild eine übermäßige Menge Rauschen in bestimmten oder gar allen Bereichen enthalten; wenn der Schwellenwert zu hoch ist, kann es unzureichende Bilddetails in bestimmten oder gar allen Bereichen enthalten, wodurch die nachfolgende Verarbeitung dieses Bildes erschwert wird. Angesichts dieser Situation wird in der Technik ein Ansatz bevorzugt, bei dem ein für jedes Pixel in dem gescannten Bild geeigneter, unterschiedlicher Schwellenwert ausgewählt wird. Der geeignete Schwellenwert wird nach den lokalen Eigenschaften des Bildes bestimmt, d.h. nach bestimmten Bildeigenschaften, die in einem lokalen Bildbereich für dieses Pixel auftreten. Der Schwellenwert würde somit über dem Bild variieren und sich möglicherweise sogar an wechselnde lokale Bildbedingungen anpassen.
  • Ein gängiges Verfahren zur veränderlichen Schwellenwertverarbeitung beruht im Allgemeinen auf der Messung lokalisierter Bilddateneigenschaften, wie dem lokalen Intensitätskontrast (oder Gradienten), einer lokal gemittelten Intensität und/oder lokalen Abweichung, in einem lokalen, um ein bestimmtes Pixel zentriertes Fenster, und auf der Verwendung dieser Messwerte zur Klassifizierung von Bildpixeln in schwarze Objektpixel oder weiße Hintergrundpixel. Hier weicht die Wirklichkeit allerdings ebenfalls vom Ideal insofern ab, als dass das Verfahren kompliziert und oft enttäuschend ist, weil zahlreiche Objekte in einem weiten Bereich von Dokumenten mit minimalem Benutzereingriff extrahiert werden müssen, beispielsweise zum Zwecke der Initialisierung und Objektidentifizierung, wobei in dem der Schwellenwertverarbeitung unterzogenen Bild ein sauberer Hintergrund erzeugt werden muss. In der Praxis kann es sich dabei um Objekte handeln, die z.B. gedämpft oder unterbrochen sind, und Objekte, die einen relativ niedrigen Kontrast aufweisen, beispielsweise weiße Objekte vor einem grauen Hintergrund und graue Objekte, die in einem schwarzen Hintergrund eingebettet sind.
  • Aufgrund der Unmöglichkeit, einen festen Schwellenwert festzulegen, um mit Bildern eine adäquate Leistung zu erzielen, sind in der Technik verschiedene Ansätze mit veränderlicher Schwellenwertverarbeitung beschrieben worden, die eine zufriedenstellende Leistung zu erbringen versuchen.
  • Alle diese Ansätze unterliegen jedoch einem oder mehreren Nachteilen, die deren Praxisnutzen einschränken.
  • Verschiedene Ansätze, die auf Messungen verschiedener, lokalisierter Bildeigenschaften beruhen, werden M. Kamel et al., "Extraction of Binary Character/Graphics Images from Grayscale Document Images", CVGIP: Graphical Models and Image Processing, Band 55, Nr. 3, Mai 1993, Seite 203–217, beschrieben. Hier basiert ein "Logikstufenansatz" auf dem Vergleich einer Graustufe eines gegebenen Pixels oder dessen glättester Graustufe (wenn das Bild verrauscht ist) mit vier lokalen Mittelwerten in der zentrierten Nachbarschaft von vier Pixeln, die das gegebene Pixel orthogonal umgeben. Wenn die Graustufe des gegebenen Pixels weit genug unter allen vier lokalen Mittelwerten liegt, wird das gegebene Pixel extrahiert. Ein anderer Ansatz, eine so genannte "maskenbasierende Subtraktion", beruht auf der Betrachtung jedes Pixels in einem Bild als eine Summe eines Hintergrundbildes und eines Zeichen-/Grafikbildes. Zunächst werden die meisten der Hintergrundpixel mit einem Logikfilter erkannt; das Filter entfernt dabei "Partikelrauschen". Das Filter wird an vier Pixelfolgen angelegt, die vier geraden Linien entsprechen, die durch jedes gegebene Pixel mit Steigungen von 0, π/4, π/2 und 3π/4 führen. Das resultierende "gefilterte" binäre Bild enthält Zeichen/Grafik-Pixel, die schwarz sind, und Hintergrundpixel, die weiß sind. Dieses gefilterte oder "maskierte" Bild wird anschließend durch die Erkennung zusätzlicher Hintergrundpixel mithilfe einer vorbestimmten Hubweite modifiziert, worauf für jedes mögliche Zeichen-/Grafik-Pixel die Graustufe des Hintergrundbildes durch lineare Interpolation von vier Hintergrundpixeln ausgewertet wird. Schließlich wird ein Graustufen-Zeichen-/Grafikbild erzeugt, indem das ausgewertete Hintergrundbild vom ursprünglich gescannten Bild subtrahiert wird, wobei die resultierenden Differenzen dann einer globalen Schwellenwertverarbeitung unterzogen werden, um ein binäres Zeichen-/Grafikbild zu erhalten. Der globale Schwellenwert selbst steht zwar fest, aber indem das Ergebnis auf einer Differenz zwischen diesem Schwellenwert und einem veränderlichen Hintergrundwert beruht, wird grundsätzlich ein veränderlicher Schwellenwert implementiert. Auf den ersten Blick erscheinen diese beiden Ansätze relativ rauschfest zu sein, aber in der Praxis ist jeder dieser Ansätze gegenüber Rauschen äußerst empfindlich und erzeugt oft einen rauschigen Hintergrund, wenn schwache und/oder unterbrochene Objekte in einem einer Schwellenwertoperation unterzogenen Bild extrahiert werden.
  • Ein weiterer Ansatz, der in US-A-4,868,670 (am 19.09.1989 an R.R.A. Morton erteilt und an die Abtretungsempfängerin der vorliegenden Anmeldung abgetreten wurde) beschrieben wird, beruht darauf, einen Hintergrundwert in einem Bild zu verfolgen, wobei ein Schwellenwert eine Summe eines nachverfolgten Hintergrundwerts, eines Rauschsignals und eines Rückmeldesignals ist. Sobald ein Übergang in einem Bild stattfindet, beispielsweise als eine Kante, wird das Rückmeldesignal sofort in einem vorbestimmten Muster verändert, um den Schwellenwert derart zu verändern, dass ein ausgabegefilterter, einer Schwellenwertverarbeitung unterzogener Pixelwert einen reduzierten Rauschanteil aufweist. In der Praxis weist diese Technik oft Grenzartefakte bei Intensitätsübergängen aufgrund abrupter Änderungen in der Hintergrundintensität auf. Da die Hintergrundverfolgung tendenziell eine schlechte Zuverlässigkeit besitzt, unterliegt dieser Ansatz Schwierigkeiten in der Erkennung kontrastarmer Objekte.
  • Ein weiterer Ansatz wird in US-A-4,468,704 beschrieben (erteilt an J.C. Stoffel et al am 28. August 1984). Hier wird eine adaptive Schwellenwertverarbeitung durch Verwendung eines Bild-Offsetpotenzials implementiert, das pixelweise als eine Funktion der weißen Spitzen- und schwarzen Talpotenziale des Bildes ermittelt wird. Dieses Offsetpotenzial dient in Verbindung mit den nächst benachbarten Pixeln dazu, einen aktualisierten Schwellenwert bereitzustellen, der sich pixelweise verändert. Die Spitzen- und Talpotenziale werden für jedes Bildpixel erzeugt, indem das Bildpotenzial dieses Pixels mit einem vorbestimmten minimalen weißen Spitzenpotenzial und einem maximalen schwarzen Talpotenzial verglichen wird. Leider weist diese Technik offenbar Schwierigkeiten bei der Extraktion kontrastarmer Objekte in einem einer Schwellenwertverarbeitung unterzogenem Bild auf.
  • Die französische Patentanmeldung Nr. 2,517,092 (veröffentlicht am 5. Mai 1983), beschreibt eine Vorrichtung zur Umwandlung eines Graustufenbildes in ein binäres Bild mithilfe eines sich dynamisch verändernden Schwellenwerts. Die Verwendung eines derartigen sich verändernden Schwellenwerts bedarf leider einer recht komplexen Schaltung. Wenn ein derartiger Schwellenwert einen geeigneten Wert zur Verwendung mit kontrastarmen Objekten annehmen soll, und wenn berücksichtigt wird, wie schnell, in Bezug auf Pixelabstände, sich dieser Schwellenwert ändert, ist im Umgebungsbereich und/oder in anderen Bereichen des resultierenden binären Bildes die Entstehung von übermäßigem Bildrauschen, reduzierter Detaillierung des Bildes oder anderen unerwünschten Bildartefakten wahrscheinlich.
  • US-A-5,268,773 (erteilt am 7.12. 1993 an Y. Park et al) beschreibt zudem eine Vorrichtung zur Binärisierung eines Graustufenbildes mithilfe eines sich dynamisch verändernden Schwellenwerts, wobei der Schwellenwert den Bildhintergrund adaptiv verändert. Wenn man voraussetzt, dass diese Technik einen sich ändernden Schwellenwert verwendet, unterliegt sie wahrscheinlich den gleichen Nachteilen wie die in der französischen Anmeldung 2,157,092 beschriebene Vorrichtung sowie die zuvor und unter Bezug auf US-A-4,878,670 beschriebenen Techniken.
  • Es besteht demnach Bedarf nach einer Technik und insbesondere einer Vorrichtung und einem zugehörigen Verfahren zur genauen und zuverlässigen Schwellenwertverarbeitung eines Graustufenbildes zur Ermittlung darin befindlicher Objekte unter Verwendung eines Schwellenwerts, der sich auf der Grundlage lokaler Bildeigenschaften verändert. Diese Technik sollte eine höhere Rauschstörfestigkeit und weniger Grenzartefakte aufweisen sowie eine erhöhte Genauigkeit in der Erkennung kontrastarmer Objekte, als dies bei herkömmlichen Techniken mit veränderlicher Schwellenwertbildung der Fall ist.
  • Die vorliegende Erfindung löst die beschriebenen Nachteile durch Verwendung einer Mehrfenster-Schwellenwerttechnik.
  • Die vorliegende Erfindung ermittelt für jedes Pixel(i,j) in einem eingehenden gescannten Graustufen-Bitmap-Bild einen örtlichen Lichtstärkegradienten G(i,j). Dieser Gradient wird für ein Fenster von 3-mal-3 Pixeln ermittelt, das um Pixel(i,j) angeordnet ist. Als nächstes wird die kleinste Lichtstärke, Lmin, die größte Lichtstärke, Lmax für ein Fenster von N-mal-N Pixeln ermittelt, das über dem Bild um Pixel(i,j) mittig angeordnet ist. Zudem wird ein lokalisierter Flächengradient, GS(i,j) als Summe einzelner Lichtstärkegradienten für eine Matrix (Fenster) von Pixelpositionen bestimmt, typischerweise n-2-mal-n-2 Pixel, mittig um Position (i,j) angeordnet. Vorwiegend unter Bezug auf den Flächengradienten GS(i,j) und zweitens nach den zugehörigen Werten Lmin und Lmax wird jedes Pixel(i,j) dann als Objektpixel, d.h. schwarzes Pixel, oder als Hintergrundpixel, d.h. weißes Pixel, klassifiziert. Diese drei Parameter werden dann für jedes Pixel(i,j) in dem Bild ermittelt, in dem das Pixel in verschiedenen Fenstern mittig angeordnet ist, eines, um beide Lichtstärkegradienten G(i,j) zu bestimmen, und das andere, um die zugehörigen Werte Lmin und Lmax zu bestimmen. Sobald die Lichtstärkegradientenwerte bestimmt worden sind, werden sie um das Pixel an der Position (i,j) herum angeordnet, um den entsprechenden Flächengradienten GS(i,j) zu bestimmen.
  • Mithilfe dieser lokalen Maße wird jedes Bildpixel(i,j) zunächst danach klassifiziert, ob es an einer Kante liegt oder nicht. Jedes an einer Kante liegende Pixel wird dann danach klassifiziert, ob die lokalen Maße dafür, insbesondere der zugehörige Flächengradient, einen vorbestimmten Schwellenwert überschreitet. Andernfalls gilt das Pixel als ein Pixel, das in ein örtlich flaches Feld fällt, also in eine relativ konstante Graustufe. Kantenpixel werden insbesondere durch Vergleichen ihrer Lichtstärkewerte mit mittleren Lichtstärkewerten für lokale N-mal-N-Pixel-Fenster klassifiziert; im Unterschied dazu werden Pixel in flachen Feldern durch Vergleichen ihrer Lichtstärke mit einem vorbestimmten Lichtstärkewert klassifiziert.
  • Ein in der Nähe einer Kante in dem Bild liegendes Bildpixel(i,j) wird immer dann erkannt, wenn der Flächengradient GS(i,j) für das Pixel hoch ist, und zwar insbesondere größer als ein vorbestimmter Gradientenschwellenwert GT. Sobald ein derartiges Pixel gefunden worden ist, wird jedes Pixel auf einer dunkleren Seite der Kante gefunden. Dieses letztgenannte Pixel eines lokalen, N-mal-N großen, d.h. 7-mal-7 großen Pixelfensters wird als ein Objektpixel klassifiziert, d.h. als schwarz, wenn dessen Lichtstärke Lc kleiner als ein mittlerer Wert der zugeordneten Werte Lmin und Lmax ist. Wenn die Lichtstärke des Pixels Lc den mittleren Lichtstärkewert von Lmin und Lmax überschreitet, dann wird dieses Pixel als Hintergrundpixel klassifiziert, d.h. als weiß.
  • Wenn der Flächengradient GS(i,j) für das Pixel(i,j) kleiner als der Gradientenschwellenwert ist, also wenn das N-mal-N Fenster entlang eines Bildbereichs aus relativ konstanten Graustufen verläuft, wird Pixel(i,j) durch eine einfache Schwellenwertoperation klassifiziert, d.h. durch Vergleichen des Graustufenwerts mit einem konstanten, vordefinierten Schwellenwert IT. Wenn der Graustufenwert von Pixel(i,j) kleiner als der Schwellenwert IT ist, wird das Pixel als ein Objektpixel klassifiziert, d.h. als schwarzes Pixel. Andernfalls wird das Pixel als Teil des Hintergrunds eingestuft, d.h. als weißes Pixel.
  • Um die Bildkanten anzuheben und damit die Schwellenwertgenauigkeit zu verbessern, werden die Intensitätswerte dieser Pixel nahe einer Kante modifiziert. Für das bevorzugte Ausführungsbeispiel werden schwarze Pixel durch den Wert "0" und weiße Pixel durch den Wert "1" dargestellt. Für die Pixel, die auf der dunkleren Seite einer Kante liegen und deren Lichtstärkewert den Schwellenwert IT überschreitet, wird der Lichtstärkewertfedes Pixels auf einen Wert unterhalb eines Schwellenwerts IT reduziert, z.B. auf einen Wert IT–. Im Unterschied dazu werden die Lichtstärkewerte für die Pixel, die auf einer helleren Seite einer Kante liegen und deren Lichtstärkewert kleiner als der Schwellenwert IT ist, auf einen Lichtstärkewert erhöht, der etwas größer als der Schwellenwert IT ist, z.B. auf den Wert IT+. Ein hochwertiges binäres Bild lässt sich dann dadurch erzeugen, indem man das resultierende Graustufenbild einfach einer Schwellenwertoperation gegen einen vorbestimmten Schwellenwert IT unterzieht.
  • Durch die Verwendung eines Flächengradienten (addierte Lichtstärke) reduzieren sich bei der vorliegenden Erfindung das Hintergrundrauschen und die Grenzartefakte deutlich, während die Objekte in einem einer Schwellenwertoperation unterzogenen Bild genauer extrahiert werden. Bei nachfolgender Schwellenwertverarbeitung des modifizierten Graustufenbildes mit einem festen Schwellenwert IT verbessert sich die Erkennung kontrastarmer Objekte erheblich, wodurch die Produktion eines hochwertigen binären Bildes erleichtert wird.
  • Die Erfindung wird im folgenden anhand in der Zeichnung dargestellter Ausführungsbeispiele näher erläutert. Es zeigen
  • 1 eine schematische Darstellung eines erfindungsgemäßen Dokumentbildverarbeitungssystems;
  • 2 die richtige Anordnung von 2A und 2B;
  • 2A und 2B ein schematisches Ablaufdiagramm des erfindungsgemäßen Mehrfenster-Schwellenwertverarbeitungsverfahrens;
  • 3A eine 3×3-Matrix der Pixelortdefinitionen, die durch einen "Sobel"-Gradientenoperator zur Bestimmung der Gradientenstärke des aktuellen Pixels(i,j) verwendet werden;
  • 3B eine grafische Darstellung einer NxN-Nachbarschaft von Pixeln, die um ein aktuelles Pixel(i,j) in einer Bildstärkeaufzeichnung mittig angeordnet sind;
  • 3C eine grafische Darstellung einer (N-2)-x-(N-2)-Nachbarschaft von Pixeln, die um ein aktuelles Pixel(i,j) in einer Bildstärkegradientenaufzeichnung mittig angeordnet sind;
  • 4 das Lichtstärkeprofil 400 einer exemplarischen Abtastlinie eines originalen Graustufenbildes, wie etwa das auf Dokument 10 in 1 gezeigte;
  • 5 eine grafische Darstellung eines modifizierten Lichtstärkeprofils, das nach erfindungsgemäßer Schwellenwertverarbeitung des Lichtstärkeprofils 400 in 4 erzeugt wird;
  • 6 ein Blockdiagramm eines bevorzugten Ausführungsbeispiels der vorliegenden Erfindung;
  • 7 ein Blockdiagramm der Gradientensummenschaltung 620, die Teil der in 6 gezeigten Schaltung 600 ist; und
  • 8 ein Blockdiagramm des 7×7-Maximum-und-Minimum-Detektors 635, der ebenfalls Teil der in 6 gezeigten Schaltung ist;
  • Zum besseren Verständnis wurden, soweit möglich, identische Bezugszeichen verwendet, um identische Elemente zu bezeichnen, die den verschiedenen Figuren gemeinsam sind.
  • Nach Lesen der folgenden Beschreibung werden Fachleute schnell erkennen, dass die vorliegende Erfindung zur Verwendung in nahezu jedem Dokumentbildverarbeitungssystem zur genauen Schwellenwertverarbeitung gescannter Dokumentbilder anwendbar ist, die Strichlinien enthält, und zwar unabhängig davon, was die Strichlinien enthalten und unabhängig von den Medien, auf denen das Bild ursprünglich erschienen ist. Beispielsweise könnten die Strichlinien Kurven, Karten, Zeichen und/oder Strichzeichnungen (Skizzen) sein. Zur Vereinfachung der folgenden Besprechung wird die vorliegende Erfindung im Zusammenhang mit der Schwellenwertverarbeitung gescannter Zeichendaten erläutert, beispielsweise Textbuchstaben oder Ziffern, die nachfolgend zusammen als "Objekte" bezeichnet werden.
  • Zum Zwecke der Darstellung und Erläuterung sind schwarze und weiße Graustufenpixel derart definiert, dass sie einen 8-Bit-Graustufenwert von "0" bzw. "255" aufweisen. Aus Gründen der Konsistenz seien ausgegebene binäre Pixel derart definiert, dass "0" für schwarz und "1" für weiß steht. Das erfindungsgemäße Verfahren arbeitet selbstverständlich ebenso gut mit entgegengesetzten Definitionen, allerdings mit all den relevanten Ungleichheiten beim Vergleichen von Pixelstärken, wie Fachleuten klar sein wird, zu den gezeigten und beschriebenen.
  • 1 zeigt eine schematische Darstellung eines erfindungsgemäßen Dokumentbildverarbeitungssystems 5. Wie gezeigt, besteht das Dokumentbildverarbeitungssystem 5 aus einem Graustufenscanner 20, einem Digitalbildprozessor 30 und einer "einfachen" Schwellenwertverarbeitungsschaltung 40. Im Betrieb wird das verschiedene Objekte enthaltende Dokument 10 vom Graustufenscanner 20 gescannt, um Bitmap-Graustufenbilddaten, L, aus mehreren Bit, typischerweise 8 Bit, zu erzeugen. Diese Daten werden über die Leitungen 25 zu einem Dateneingang des Digitalbildprozessors geleitet, der in dem hier relevanten Maße die gescannten Bilddaten einer Schwellenwertverarbeitung unterzieht und sowohl ein modifiziertes Graustufenbild auf den Leitungen 37 als auch ein binäres Ausgabebild auf den Leitungen 33 erzeugt. Die Kanten des modifizierten Graustufenbilds werden, wie nachfolgend detaillierter beschrieben, durch den Digitalbildprozessor 30 hervorgehoben, um die Genauigkeit der nachfolgenden Schwellenwertverarbeitung zu verbessern. Die an Leitung 37 anliegenden modifizierten Graustufenbilddaten werden an einen Eingang der Schwellenwertverarbeitungsschaltung 40 angelegt, die jedes Mehrbit-Bildpixel in den modifizierten Bilddaten anhand einer so genannten "einfachen" Schwellenwertoperation mit einem vorbestimmten, festen Schwellenwert vergleicht. Das von der Schwellenwertverarbeitungsschaltung 40 resultierende, einer Schwellenwertoperation unterzogene, d.h. binäre Bild wird über die Leitungen 45 als ein weiteres binäres Ausgabebild angelegt. Der Digitalbildprozessor 30 führt die Schwellenwertverarbeitung erfindungsgemäß durch. Um die hohen Datendurchsätze aufnehmen zu können, die zur Verarbeitung von Bitmap-Bildern erforderlich sind, ist der Digitalbildprozessor 30 vorzugsweise als eine spezielle Hardwareschaltung ausgebildet, die die in 6 gezeigte erfindungsgemäße Schaltung umfasst, wie nachfolgend detaillierter besprochen wird. Alter nativ hierzu ist dieser Prozessor durch einen oder mehrere Vielzweck-Mikroprozessoren implementierbar, und zwar mit der zugehörigen Speicher- und Unterstützungsschaltung und in entsprechender Weise programmiert, um die vorliegende Erfindung softwaremäßig zu implementieren, vorausgesetzt, der Mikroprozessor kann die Anweisungen ausreichend schnell ausführen, um den erforderlichen Datendurchsatz zu erzielen.
  • 2A und 2B zeigen gemeinsam ein Übersichtsdiagramm des erfindungsgemäßen Mehrfenster-Schwellenwertverarbeitungsverfahrens 200, wobei 2 die richtige Anordnung der beiden einzelnen Zeichnungen darstellt. Im Verlauf der weiteren Erörterung des Mehrfenster-Schwellenwertverarbeitungsverfahrens 200 wird an geeigneter Stelle Bezug auf 3A3C genommen.
  • Das Mehrfenster-Schwellenwertverarbeitungsverfahren 200 wird für jedes Graustufenpixel im eingehenden Bild durchgeführt, wobei das Bild nacheinander durchgearbeitet wird. Da die Art und Weise, in der jedes Graustufenbildpixel verarbeitet wird, über sämtliche Pixel gleich ist, wird im Folgenden diese Routine nur im Zusammenhang mit der Verarbeitung allgemeiner Pixel(i,j) besprochen, wobei i und j positive ganze Zahlen sind und horizontale und vertikale Pixelindizes in dem eingehenden Graustufenbild bezeichnen. Zusätzlich zu den Graustufenbilddaten gibt ein Benutzer Werte von zwei Eingabeparametern ein, nämlich die festen Schwellenwerte IT und GT. Diese Schwellenwerte werden, wie nachfolgend beschrieben, entweder auf eine zufriedenstellende Schwellenwertverarbeitung von einer Mehrzahl unterschiedlicher Bilder mit wechselnden Eigenschaften abgestimmt, wie beispielsweise Kontrast und Beleuchtung, oder sie werden auf eine optimale Schwellenwertbildung für jeden Bildtyp und/oder jede Abtastbedingung abgestimmt. In jedem Fall wird als Ergebnis der Durchführung des Verfahrens 200 für alle diese Graustufenbildpixel ein einer Schwellenwertverarbeitung unterzogenes binäres oder modifiziertes Graustufenbild erzeugt, wobei jedes Pixel in dem resultierenden Bild einem Pixel in dem Eingangsbild entspricht. Wenn ein modifiziertes Graustufenbild erzeugt werden soll, wird dieses Bild in "einfacher" Weise mithilfe eines festen, vorbestimmten Schwellenwerts IT einer Schwellenwertverarbeitung unterzogen, wobei dieser Wert, obwohl dies nicht in 2A und 2B gezeigt wird, nachfolgend definiert wird. Das modifizierte Graustufenbild wird dann nach Bedarf weiter verarbeitet, z.B. durch Skalieren oder Filterung.
  • Bei Einstieg in das Verfahren 200 wird zunächst Schritt 203 ausgeführt. Dieser Schritt ermittelt eine Gradientenstärke für Pixel(i,j). Dies erfolgt mithilfe des so genannten "Sobel"-Gradienten anhand eines um Pixel(i,j) mittig angeordneten Fensters. Wie in 3A gezeigt, ist diese Matrix 300 eine als Fenster um Pixel(i,j) zentrierte 3×3-Matrix. Wie in den nachfolgenden Gleichungen (1)–(3) definiert, beruht der Sobel-Operator auf der Berechnung horizontaler bzw. vertikaler Pixelstärkegradienten GX(i,j) und GY(i,j) sowie auf der Bildung der Gradientenstärke G(i,j) als eine absolute Summe von GX(i,j) und GY(i,j) für jede Pixelposition
    (i,j)
    GY(i,j): GX(i,j) = L(i+1,j–1) + 2L(i+1,j) + L(i+1,j+1) – L(i–1,j–1) – 2L(i–1,j) – L(i–1,j+1) (1) GY(i,j) = L(i–1,j+1) + 2L(i,j+1) + L(i+1,j+1) – L(i–1,j-1) – 2L(i,j–1) – L(i+1,j–1) (2) G(i,j) = |GX(i,j)| + |GY(i,j)| (3)worin: G(i,j) die Gradientenstärke an der Pixelpositon I(ij) ist und L(i,j) die Bildstärke, Luminanz, an Pixelposition (i,j).
  • Der resultierende Gradientenstärkewert für jedes Bildpixel bildet kollektiv eine Gradientenstärke für das gesamte gescannte Bild.
  • Sobald die Gradientenstärke G(i,j) für Pixel(i,j) bestimmt ist, schreitet das Verfahren 200 mit Schritt 206 fort. Dieser Schritt ermittelt bei seiner Ausführung den Flächengradienten für die Pixelposition (i,j), d.h. GS(i,j) als Summe der Gradientenstärken für jede Pixelposition innerhalb eines um die Pixelposition (i,j) herum mittig angeordneten Fensters. Dieses Fenster wird als 5×5 Pixel großes Fenster 370 in 3C dargestellt, als N×N großes Fenster, hier als 7×7 großes Fenster, in 3B, wobei es sich bei dem Letzteren um das um Pixel(i,j) herum angeordnete Fenster 330 handelt. Für Vergleichszwecke wird die Umgebung eines N×N großen Fensters als Fenster 350 in 3C gezeigt. Obwohl zur Verdeutlichung sequenziell dargestellt, wird der Schritt 245 im Allgemeinen im Wesentlichen gleichzeitig durchgeführt, wie durch die Strichlinie 244 gezeigt, und zwar ebenso wie die Schritte 203 und 206. Schritt 244 ermittelt sowohl die minimalen wie die maximalen Pixelstärkewerte, Lmin bzw. Lmax, in einem um Pixel(i,j) herum mittig angeordneten N×N-Fenster.
  • Sobald der Flächengradient für Pixelposition (i,j) ermittelt ist, werden für den Rest des Verfahrens 200 die drei Bildmaße, nämlich GS(i,j) sowie Lmin und Lmax, die dieser bestimmten Pixelposition zugeordnet sind, zur Klassifizierung von Pixel(i,j) als ein Objektpixel verwendet, d.h. als schwarzes Pixel, oder als Hintergrundpixel, d.h. als weißes Pixel.
  • Der Entscheidungsschritt 208 wird durchgeführt, um zu ermitteln, ob der Wert des Flächengradienten für Pixel(i,j), d.h. GS(i,j), einen vorbestimmten Schwellenwert GT überschreitet. Dieser Test ermittelt, ob Pixel(i,j) in Nachbarschaft einer Kante in dem gescannten Bild liegt oder nicht. Wenn der Flächengradient kleiner als der Schwellenwert GT ist, dann liegt Pixel(i,j) nicht in Nähe einer Kante. Pixel (i,j) liegt somit in einem lokalisierten, relativ konstanten Tonbereich, d.h. in einem "flachen" Feld des gescannten Graustufenbildes. In diesem Fall fährt das Verfahren 200 entlang des NEIN-Pfads 211 fort, der vom Entscheidungsblock 208 zum Entscheidungsblock 215 führt. Der letztgenannte Entscheidungsblock bestimmt, ob die Graustufenstärke der Pixel(i,j), d.h. Lc, einen anderen, vorbestimmten Schwellenwert IT überschreitet. Wenn der Graustufenwert kleiner als der Schwellenwert ist, wird das Pixel als ein Objektpixel klassifiziert, d.h. in diesem Fall schwarz; andernfalls wird das Pixel als ein Hintergrundpixel klassifiziert, d.h. in diesem Fall weiß. Wenn die Pixelstärke Lc allerdings kleiner oder gleich dem Schwellenwert IT ist, fährt der Entscheidungsblock 215 mit dem Verfahren 200 über den NEIN-Pfad 217 bis zum Entscheidungsblock 222 fort. Dieser Entscheidungsblock ermittelt, ob ein Benutzer das Verfahren zuvor angewiesen hat, ein binäres oder ein Graustufen-Ausgabepixel zu erzeugen. Wenn ein binäres Pixel gewünscht wird, schreitet der Entscheidungsblock 222 mit dem Verfahren über den JA-Pfad 225 zum Block 228 fort, der wiederum eine Stärke des Ausgabepixels (i,j) auf schwarz, d.h. auf null setzt. Wenn eine Graustufenausgabe gewünscht wird, schreitet das Verfahren über den NEIN-Pfad 224 mit dem Entscheidungsblock 222 zum Block 230 fort. Dieser Block setzt bei Ausführung die Stärke des Ausgabepixels (i,j) auf die Stärke Lc, ohne daran Modifikationen vorzunehmen. Wenn andererseits die Pixelstärke Lc den Schwellenwert IT überschreitet, fährt der Entscheidungsblock 215 über den JA-Pfad 217 zum Entscheidungsblock 232 fort. Dieser Entscheidungsblock ermittelt, ob ein Benutzer das Verfahren zuvor angewiesen hat, ein binäres oder ein Graustufen-Ausgabepixel zu erzeugen. Wenn ein binäres Pixel gewünscht wird, schreitet der Entscheidungsblock 232 mit dem Verfahren über den JA-Pfad 235 zum Block 237 fort, der wiederum eine Stärke des Ausgabepixels (i,j) auf weiß, d.h. auf eins setzt. Wenn eine Graustufenausgabe gewünscht wird, schreitet das Verfahren über den NEIN-Pfad 232 mit dem Entscheidungsblock 234 zum Block 241 fort. Dieser Block setzt bei Ausführung die Stärke des Ausgabepixels (i,j) auf die Stärke Lc, ohne daran Modifikationen vorzunehmen. Sobald Schritt 228, 237 oder 241 durchgeführt worden ist, ist das Verfahren 200 für Pixel (i,j) abgeschlossen; das Verfahren wird dann für das nächste Bildpixel in Folge wiederholt usw.
  • Alternativ hierzu, wenn der Flächengradient GS(i,j) den Schwellenwert GT überschreitet, liegt Pixel(i,j) in der Nähe einer Kante. In diesem Fall wird Schritt 245 durchgeführt, um die Werte von Lmax und Lmin zu bewerten, falls diese Werte nicht bereits ermittelt worden sind, wie zuvor ausgeführt. Anschließend fährt Verfahren 200 mit Block 248 fort, der einen mittleren Pixelstärkewert Lavg berechnet, der in dem um Pixelposition (i,j) mittig angeordneten N×N-Pixelfenster liegt. Der mittlere Stärkewert wird durch Mittelung der Werte Lmax und Lmin ermittelt.
  • Sobald dieser Mittelwert bestimmt worden ist, fährt das Verfahren mit dem Entscheidungsblock 251 fort, der die Stärke des Pixels(i,j), d.h. Lc, mit dem zugehörigen mittleren Stärkewert Lavg vergleicht. Wenn sich das Pixel auf einer dunkleren Seite einer Kante befindet und somit ein Objektpixel ist, dann ist der zugehörige mittlere Stärkewert größer als oder gleich dem Stärkewert Lc. In diesem Fall wird das binäre Ausgabepixel für Pixelposition (i,j) auf schwarz gesetzt. Wenn sich Pixel(i,j) in Nähe einer Kante befindet, dessen mittlerer Stärkewert Lavg aber kleiner als dessen Stärkewert Lc ist, dann wird dieses Pixel der helleren Seite einer Kante zugeordnet und ist somit ein Hintergrundpixel; das entsprechende binäre Ausgabepixel wird also auf weiß gesetzt. Wenn Graustufenausgabewerte anstelle binärer Werte erzeugt werden sollen, werden die Graustufenwerte für die entsprechenden Ausgabepixel auf Basis der eingehenden Pixelwerte Lc modifiziert, wie nachfolgend beschrieben, um die Kanten hervorzuheben und die Schwellenwertgenauigkeit zu erhöhen.
  • Wenn die Graustufen-Pixelstärke Lavg für Pixel(i,j) kleiner als oder gleich dem zugehörigen mittleren Stärkewert Lavg ist, fährt das Verfahren vom Entscheidungsblock 251 über den NEIN-Pfad 254 zum Entscheidungsblock 260 fort. Dieser Entscheidungsblock ermittelt, ob ein Benutzer das Verfahren zuvor angewiesen hat, ein binäres oder ein Graustufen-Ausgabepixel zu erzeugen. Wenn ein binäres Pixel gewünscht wird, schreitet der Entscheidungsblock 260 mit dem Verfahren über den JA-Pfad 265 zum Block 268 fort, der wiederum eine Stärke des Ausgabepixels (i,j) auf schwarz, d.h. auf null setzt. Wenn allerdings eine Graustufenausgabe gewünscht wird, schreitet das Verfahren 200 über den NEIN-Pfad 260 mit dem Entscheidungsblock 262 zum Block 270 fort. Der letztgenannte Block ermittelt bei Ausführung, ob die Pixelstärke Lc den vorbestimmten Schwellenwert IT überschreitet. Wenn die Stärke von Pixel(i,j) kleiner oder gleich dem Schwellenwert IT ist, fährt das Verfahren über den NEIN-Pfad 272 zum Block 275 fort, der bei Ausführung die Graustufenausgabe für Pixel(i,j) auf den Pixelstärkewert Lc setzt. Wenn die Stärke von Pixel(i,j) den Schwellenwert IT überschreitet, fährt das Verfahren 200 über den JA-Pfad 274 zum Block 278 fort, der bei Ausführung die Graustufenausgabe für Pixel(i,j) auf einen Wert setzt, der geringfügig kleiner als der Schwellenwert IT ist, d.h. IT–.
  • Wenn die Graustufen-Pixelstärke Lc den zugehörigen mittleren Stärkewert Lavg überschreitet, fährt das Verfahren 200 vom Entscheidungsblock 251 über den JA-Pfad 253 zum Entscheidungsblock 280 fort. Dieser Entscheidungsblock ermittelt, ob ein Benutzer das Verfahren zuvor angewiesen hat, ein binäres oder ein Graustufen-Ausgabepixel zu erzeugen. Wenn ein binäres Pixel gewünscht wird, schreitet der Entscheidungsblock 280 mit dem Verfahren über den JA-Pfad 282 zum Block 285 fort, der wiederum eine Stärke des Ausgabepixels (i,j) auf weiß, d.h. auf eins, setzt. Wenn allerdings eine Graustufenausgabe gewünscht wird, schreitet das Verfahren 200 über den NEIN-Pfad 280 mit dem Entscheidungsblock 284 zum Block 290 fort. Der letztgenannte Block ermittelt bei Ausführung, ob die Pixelstärke Lc kleiner als der vorbestimmte Schwellenwert IT ist. Wenn die Stärke von Pixel(i,j) den Schwellenwert IT überschreitet oder gleich diesem ist, fährt das Verfahren über den NEIN-Pfad 292 zum Block 295 fort, der bei Ausführung die Graustufenausgabe für Pixel(i,j) auf den Pixelstärkewert Lc setzt. Wenn die Stärke von Pixel(i,j) den Schwellenwert IT unterschreitet, fährt das Verfahren 200 über den JA-Pfad 294 zum Block 297 fort, der bei Ausführung die Graustufen-ausgabe für Pixel(i,j) auf einen Wert setzt, der geringfügig größer als der Schwellenwert IT ist, d.h. IT+. Der genaue Betrag, um den IT+ oder IT- größer oder kleiner als der Schwellen-wert IT ist, ist nicht so wichtig und lässt sich empirisch ermitteln. Sobald Schritt 268, 275, 285, 295 oder 297 für Pixel(i,j) durchgeführt worden ist, wird das Verfahren 200 für das nächste Bildpixel in Folge wiederholt usw.
  • Unter Berücksichtigung dieser Faktoren sei auf 4 hingewiesen, die das Lichtstärkeprofil 400 einer exemplarischen Abtastlinie eines originalen Graustufenbildes, wie etwa das auf Dokument 10 in 1 gezeigte, grafisch darstellt. Als Ergebnis der Verarbeitung des Profils 400 durch das erfindungsgemäße Verfahren ergibt sich das in 5 gezeigte, modifizierte Stärkeprofil 500. Wie aus einem Vergleich der Profile 400 und 500 hervorgeht, werden nur die Graustufenwerte der Bildpixel in Nähe einer Kante modifiziert. In dieser Hinsicht und wenn sich ein derartiges Pixel auf einer dunkleren Seite einer Kante befindet und wenn dessen Stärke höher als der Schwellenwert IT ist, wird die Stärke dieses Pixels auf einen Wert IT– herabgesetzt, der geringfügig unter dem Schwellenwert IT liegt. Alternativ hierzu wird, wenn sich ein Bildpixel auf einer helleren Seite einer Kante befindet und wenn dessen Stärke kleiner als der Schwellenwert IT ist, die Stärke dieses Pixels auf einen Wert IT+ erhöht, der geringfügig über dem Schwellenwert IT liegt. Ein hochwertiges Bild entsteht durch Schwellenwertverarbeitung des resultierenden, modifizierten Graustufenbildes auf Basis eines festen Schwellenwerts IT.
  • 6 zeigt ein Blockdiagramm eines bevorzugten Hardwareausführungsbeispiels, nämlich Schaltung 600, der vorliegenden Erfindung. Das Ausführungsbeispiel könnte Teil des in 1 gezeigten Digitalbildprozessors 30 sein. Der Digitalbildprozessor 30 würde selbstverständlich eine konventionelle Schaltung für die Taktung enthalten sowie weitere Steuerungs- und andere Bildverarbeitungsfunktionen; allerdings wurde diese Schaltung im vorliegenden Fall ausgelassen, da sie für das Verständnis der vorliegenden Erfindung nicht relevant ist.
  • Wie in der Abbildung gezeigt, wird die Schaltung 600 aus den Leitungsverzögerungsstufen 6101, 6102 und 6103, der Verzögerung 630, dem Gradientendetektor 615, der Summe der Gradientenschaltungen 620, den Komparatoren 625, 650 und 655, dem 7×7-Max- und Min-Detektor 635 der Mittelwertschaltung 640, den Multiplexern 680 und 690 und dem durch den Inverter 664 und die Gates 662, 670 und 675 gebildeten Gate-Schaltung 660 gebildet. Schaltung 600 implementiert kollektiv das in 2A und 2B zuvor detailliert besprochene Verfahren 200.
  • Im Betrieb werden die 8-Bit-Eingabe-Graustufenbildpixel(i,j) über die Leitungen 605 und 608 parallel zu einem Eingang der Leitungsverzögerungen 610 und zu einem Eingang des 7×7-Max- und Min-Detektors 635 geführt. Die Verzögerungsstufen 610 und insbesondere die in Reihe verbundenen Leitungsverzögerungselemente 6101, 6102 and 6103 stellen ein 3×3 großes Fenster an Bildpixeldaten bereit, das um Bildpixel(i,j) mittig angeordnet ist. Jedes Verzögerungselement ist an drei Stellen verknüpft, um jeweils eine drei Pixel breite Leitung des Fensters vorzusehen. Die Ausgaben der drei Verzögerungselemente werden zu den entsprechenden Eingängen der Gradientendetektorschaltung 615 geleitet, die unter Verwendung des Sobel-Operators, wie zuvor beschrieben, einen Stärkegradientenwert für Pixel(i,j), d.h. G(i,j) an den Ausgängen 617 berechnet. Dieser Gradientenwert wird an einen Eingang einer Summe von Gradientenschaltungen 620 angelegt, die wiederum die Gradientenstärkewerte in einem um Pixelposition (i,j) mittig angeordneten 5×5 Fenster summiert und die relevante Summe auf einer 12-Bit-Ausgangsleitung 622 als Flächengradientenwert GS(i,j) ausgibt. Die Gradientenschaltung 620 ist in 7 dargestellt und wird nachfolgend detaillierter besprochen. Dieser Flächengradientenwert wird an einen Eingang ("A") des Komparators 625 angelegt, der den Wert mit einem vorbestimmten Gradientenschwellenwert GT vergleicht, wobei der Letztere an einen anderen Eingang ("B") desselben Komparators angelegt wird. Die resultierende Komparatorausgabe auf Leitung 628 zeigt an, ob sich das Pixel(i,j) in Nähe einer Kante befindet. Die Komparatorausgabe wird an Gate 662 und 670 angelegt, um damit über den Multiplexer 690, wie nachfolgend besprochen wird, den geeigneten Graustufenwert auszuwählen, d.h. Lc oder einen der vordefinierten Werte IT– oder IT+.
  • Der in 8 gezeigte und nachfolgend besprochene Max- und Min-Detektor 635 bestimmt die maximalen und minimalen Pixelstärkewerte, d.h. Lmax und Lmin der Pixel innerhalb eines um Pixel(i,j) mittig herum angeordneten 7×7-Fensters. Die resultierenden Werte Lmax und Lmin erscheinen auf den Leitungen 637 und 639 und werden dann durch die Mittelwertschaltung 640 gemittelt. Diese Schaltung enthält den Summierer 642, der lediglich diese beiden Werte zu einer Summe addiert, die in der Divisions- und Verzögerungsschaltung 646 durch zwei dividiert wird, indem die Summe um ein Bit nach rechts verschoben wird, wodurch das niederwertige Bit wegfällt. Der resultierende gemittelte Stärkewert wird dann in der Schaltung 646 entsprechend verzögert, um eine geeignete Synchronisation in der Schaltung 600 zu erzielen.
  • Wenn der Gradientenwert GS(i,j) die vorbestimmte Gradientenschwelle GT überschreitet, wird der vorbestimmte Gradientenschwellenwert GT als gemittelter Stärkenwert Lavg als Schwellenwert zur Bestimmung des Werts des mittleren Ausgabepixels(i,j) benutzt; wenn der Gradientenwert kleiner oder gleich dem Gradientenschwellenwert ist, wird der Wert IT als Schwellenwert zur Bestimmung des Werts des mittleren Ausgabepixels(i,j) verwendet. In dieser Hinsicht wird der gemittelte Stärkenwert Lavg an einen Eingang des Komparators 650 angelegt. Der aktuelle Pixelwert Lc wird dann durch das Verzögerungselement 630 an einen anderen Eingang des Komparators 650 sowie als Eingang an den Komparator 655 angelegt. Die Verzögerung des Elements 630 wird derart eingestellt, dass der entsprechende Wert von Lc und Lavg synchron an die Komparatoren 650 und 655, an die Multiplexer 680 und 690 sowie an die Gate-Schaltung 660 angelegt wird. Der feste Schwellenwert IT wird dann an einen weiteren Eingang des Komparators 655 angelegt. Der Komparator 650 erzeugt eine niedrige oder hohe Ausgabe auf der Leitung 653, wenn der Pixelstärkewert Lc kleiner als oder gleich oder größer als der zugehörige gemittelte Stärkewert Lavg ist. Diese Ausgabe wird dann an einen Eingang ("1") des Multiplexers 680 und an einen Eingang des AND-Gates 662 angelegt. Der Multiplexer 680 wählt das ausgegebene binäre Pixel derart, dass es zwischen zwei Bits liegt, die aus zwei verschiedenen Schwellenwerten erzeugt wurden, d.h. Wert IT oder Lavg. Diesbezüglich erzeugt der Komparator 655 einen hohen Ausgabewert am Ausgang A>B, wenn der vordefinierte Schwellenwert IT kleiner als der Pixelstärkewert Lc ist. Der Pegel an Ausgang A>B wird über Leitung 657 zu einem anderen Eingang ("0") des Multiplexers 680 und zu einem Eingang des AND-Gates 670 geleitet. Der Multiplexer 680 erzeugt den ausgegebenen binären Wert für Pixel(i,j). Hierzu wird der durch den Komparator 625 ausgegebene Wert des Vergleichs, der anzeigt, ob der Flächengradient GS(i,j) den Gradientenschwellenwert GT überschreitet, als ein Auswahlsignal über Leitung 628 an einen Auswahleingang ("S") des Multiplexers 680 angelegt. Wenn das Auswahlsignal hoch ist und somit anzeigt, dass der Flächengradient den Gradientenschwellenwert überschreitet, leitet der Multiplexer 680 den an Eingang "1" angelegten Pegel, d.h. den durch Komparator 650 erzeugten, an die binäre Ausgabeleitung 33 weiter, andernfalls leitet der Multiplexer den an seinem Eingang "0" anliegenden Pegel an die Leitung 33 weiter.
  • Der Multiplexer 690 legt den Pixelwert Lc oder einen vorbestimmten Wert IT+ oder IT– als Ausgabegraustufenwert an die 8-Bit-Ausgabeleitungen 37 an. Die vorbestimmten Werte IT+ und IT– werden zusammen mit dem Pixelwer Lc an jeweils verschiedene Eingänge des Multiplexers 690 angelegt. Die Ausgabe dieses Multiplexers bestimmt sich nach dem Status der Auswahlsignale S0 und S1: wenn diese Signale den binären Wert null, 1 oder 3 annehmen, dann leitet der Multiplexer den Pixelwert Lc, den Wert IT+ bzw. den Wert IT– an die 8-Bit- Ausgabeleitungen 37 weiter. Die Gate-Schaltung 660 erzeugt in Ansprechen auf die Vergleichsausgabesignale der Komparatoren 625, 650 und 655 durch einfache Kombination der beiden Auswahlsignale S0 und S1, die an den Multiplexer 690 angelegt werden. Wenn der Flächengradient nicht größer als der Gradientenschwellenwert ist, wird, wie zuvor besprochen, der Graustufenpixelwert Lc ohne Modifikation über den Multiplexer 690 an die 8-Bit-Ausgabeleitungen 37 angelegt. Wenn der Flächengradient den Gradientenschwellenwert überschreitet, legt alternativ hierzu der Multiplexer 690 entweder den Wert IT+ oder IT– als modifizierten Graustufenausgabewert an die 8-Bit-Ausgabeleitungen 37 an, und zwar abhängig davon, ob der Stärkewert Lc kleiner als der entsprechende mittlere Pixelstärkewert Lavg ist oder nicht. Da der Betrieb der Gate-Schaltung 660 aus der vorausgehenden Beschreibung für Fachleute selbsterklärend ist, wird er an dieser Stelle nicht weiter detailliert erläutert. Die Werte IT– und IT+ werden lediglich in den entsprechenden (nicht gezeigten) Registern gehalten und von dort an die entsprechenden Eingänge des Multiplexers 690 angelegt.
  • 7 zeigt ein Blockdiagramm der Gradientensummenschaltung 620, die Teil der in 6 gezeigten Schaltung 600 ist. Die in 7 gezeigte Gradientenschaltung 620 wird aus dem Addierer 710 und der Leitungsverzögerung 720 gebildet, wobei die letztere vier in Reihe geschaltete Verzögerungselemente 7200 , 7201 , 7202 and 7203 umfasst. Die eingehenden Gradientenstärkewerte werden über die Leitung 617 von der (in 6 gezeigten) Gradientendetektorschaltung 615 an einen Eingang des in 7 gezeigten Addierers 710 angelegt. Darüber hinaus wird die Ausgabe jedes der vier Verzögerungselemente 720 über eine jeweils verschiedene der vier Rückmeldeleitungen 715 an einen anderen, entsprechenden Eingang dieses Addierers geleitet. Als Ergebnis bildet der Addierer 710 Teilsummen von 1×5-Gradientenwerten, die dann als Eingabe an das Verzögerungselement 720o angelegt werden. Um eine 5×5-Summe der Stärkegradienten zu erzeugen und somit ein Maß für den Flächengradienten zu liefern, werden vier vorausgehende, entsprechende 1×5-Summen im Addierer 710 addiert, um eine 1×5-Summe zu liefern, wobei die resultierende gesamte 5×5-Summe an die 12-Bit-Ausgangsleitung 622 angelegt wird. Die Verwendung dieser derart verbundenen Verzögerungselemente reduziert den Schaltungsaufwand erheblich, der ansonsten notwendig wäre, um 24 Zwischensummen zu bilden.
  • 8 zeigt ein Blockdiagramm des 7×7-Maximum-und-Minimum-Detektors 635, der ebenfalls Teil der in 6 gezeigten Schaltung 600 ist. Wie bereits erwähnt, ermittelt der Max- und Min-Detektor 635 die maximalen und minimalen Pixelstärkewerte Lmax bzw. Lmin innerhalb eines um Pixelposition (i,j) mittig angeordneten 7×7-Fensters. Dieser Detektor wird aus zwei getrennten Schaltungen gebildet, nämlich der Maximal-Detektorschaltung 805 und der Minimal-Detektorschaltung 840, die einen Pixelwert mit einem maximalen bzw. minimalen Stärkewert aus allen Pixeln entnimmt, die in einem um Pixel(i,j) mittig herum angeordneten 7×7-Fenster enthalten sind, und diese beiden Werte jeweils an die Leitungen 637 und 639 anlegt. Die Schaltung 805 enthält den Maximaldetektor und die Leitungsverzögerungen 820, wobei diese aus sechs in Reihe geschalteten einzelnen Leitungsverzögerungselementen 8200 , 8201 , 8202 8203 , 8204 und 8205 gebildet werden. In ähnlicher Weise enthält die Schaltung 840 den Minimaldetektor 850 und die Leitungsverzögerungen 860, wobei diese aus sechs in Reihe geschalteten einzelnen Leitungsverzögerungselementen 8600 , 8601 , 8602 8603 , 8604 und 8605 gebildet werden. Insofern, als dass die Funktion der Schaltungen 850 und 840 bis auf die Tatsache, dass der Detektor 810 maximale Werte und der Detektor 850 minimale Werte erkennt, und zwar in beiden Fällen über die gleiche Reihe von Pixelstärkewerten über die Leitung 608, wird nachfolgend nur Schaltung 850 detaillierter besprochen; Fachleute werden daraus die Funktionen für Schaltung 840 ohne Schwierigkeiten ableiten können.
  • Eingehende Pixelstärkewerte werden über Leitung 608 an einen Eingang des Maximaldetektors 810 angelegt. Darüber hinaus wird die Ausgabe jedes der sechs Verzögerungselemente 820 über eine jeweils verschiedene der sechs Rückmeldeleitungen an einen anderen, entsprechenden Eingang dieses Detektors geleitet. Der Maximaldetektor 810 entzieht den maximalen Pixelstärkewert aus einer 1×7-Reihe von Pixelwerten und legt diesen Maximalwert als Eingabe an das Leitungsverzögerungselement 8025 an. In Verbindung mit sechs vorausgehenden, entsprechenden maximalen Pixelwerten, die in den Leitungsverzögerungen 820 gespeichert sind, lokalisiert der Maximaldetektor 810 den maximalen Pixelstärkewert für das um Pixel(i,j) mittig angeordnete 7×7-Fenster und legt diesen Wert als Ausgabe an die Leitungen 637 an. Hier reduziert die Verwendung von in Reihe verbundenen Verzögerungselementen 820 und 860 den Schaltungsaufwand wesentlich, der sonst notwendig wäre, um maximale und minimale Pixelstärke-Zwischenwerte zu erzeugen.
  • Die Qualität des resultierenden einer Schwellenwertverarbeitung unterzogenen Bildes, das erfindungsgemäß erzeugt wurde, wird durch die für die Schwellenwerte GT und IT definierten Werte bestimmt. Der Schwellenwert GT wird derart eingestellt, dass er die in Nachbarschaft der Kanten eines Bildes befindlichen Bildpixel einwandfrei klassifiziert. Ein relativ niedriger GT-Wert extrahiert tendenziell Kantenpixel heller Objekte. Der Schwellenwert IT wird derart eingestellt, dass er Pixel einwandfrei klassifiziert, die sich in Bildregionen von einheitlichem Tonwert befinden, d.h. "flachen" Feldern. In dieser Hinsicht klassifizieren niedrige IT-Werte Pixel aus einheitlich grauen Bereichen als weißen Hintergrund. Bei Verwendung eines relativ hohen GT-Werts verhält sich die vorliegende Erfindung für alle Verwendungszwecke ähnlich wie eine "einfache" Schwellenwertverarbeitung mit festem Schwellenwert IT. In diesem Fall wird der Schwellenwert GT stets höher sein als der Flächengradient, was dazu führt, dass die vorliegende Erfindung Pixel im Wesentlichen ausschließlich durch Vergleichen jedes Bildpixels mit einem festen Schwellenwert IT klassifiziert. Die vorliegende Erfindung kann zudem ein Umrissbild erzeugen, indem man den Schwellenwert IT auf null setzt, wobei alle Bildpixel als weiß klassifiziert werden, außer den Kantenpixeln, deren zugehörige Flächengradienten größer als der Gradientenschwellenwert GT sind.
  • Die vorliegende Erfindung ist in Bildabtastsystemen und insbesondere zur Schwellenwertverarbeitung gescannter Graustufenbilder, die Strichgrafiken enthalten, verwendbar. Die vorliegende Erfindung stellt eine genauere Schwellenwertverarbeitung bereit als dies in der Technik bisher möglich war, indem sie eine erhöhte Störfestigkeit gegen Hintergrundrauschen im gescannten Bild aufweist und im Wesentlichen Grenzartefakte aus dem einer Schwellenwertverarbeitung unterzogenen Bild beseitigt.

Claims (8)

  1. Verfahren zur Schwellwertverarbeitung eines Graustufen-Eingangsbildes in ein erstes Ausgangsbild, wobei das Eingangsbild aus Eingangspixeln besteht, von denen jedes einen zugeordneten Multibit-Graustufenpixelwert aufweist, und wobei das erste Ausgangsbild aus Pixeln besteht, von denen jedes einen entsprechenden, zugeordneten Ausgangspixelwert aufweist, dadurch gekennzeichnet, dass das Verfahren folgende Schritte umfasst: – Ermitteln, in Abhängigkeit von einer Vielzahl von Pixelwerten im Eingangsbild, einer Summe, für ein erstes Fenster (310) vorbestimmter Größe, von Lichtstärkegradientenwerten, die einem der Pixelwerte zugeordnet sind, welche um eine aktuelle Pixelposition (i,j) (wobei i und j Pixelindizes sind) im Eingangsbild herum angeordnet sind, um einen Bereichsgradientenwert zu definieren; – Bestimmen, in Abhängigkeit von einem zweiten Fenster (330) vorbestimmter Größe von im Eingangsbild um die aktuelle Pixelposition (i,j) herum angeordneten Eingangspixeln, eines durchschnittlichen Pixelwerts, der auf einem maximalen und einem minimalen Pixelwert der in dem zweiten Fenster enthaltenden Pixelwerte basiert; und – Erzeugen, in Abhängigkeit von dem Bereichsgradientenwert und dem durchschnittlichen Pixelwert, eines aktuellen Pixelwerts der Pixelwerte für die aktuelle Pixelposition (i, j) im Eingangsbild, eines Ausgangspixelwerts in einer entsprechenden Position im ersten Ausgangsbild gegenüber einem vorbestimmten Graustufenschwellenwert IT.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Schritt für die Ermittlung des Bereichsgradienten folgende Schritte umfasst: – Messen, in Abhängigkeit von einem dritten Fenster (370) vorbestimmter Größe von um die aktuelle Pixelposition (i, j) im Eingangsbild herum angeordneten Pixelwerten, eines Lichtstärkegradienten G(i, j) für die aktuelle Pixelposition, so dass für eine Folge von Eingangspixeln im Eingangsbild eine Vielzahl von entsprechenden Lichtstärkegradienten definiert wird; und – Bilden des ersten Fensters von Lichtstärkegradienten aus der Vielzahl der Lichtstärkegradienten und Bestimmen des Bereichsgradienten in Abhängigkeit vom ersten Fenster.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass der das erste Fenster bildende, einen Bereichsgradienten bestimmende Schritt folgenden Schritt einschließt: – Addieren einzelner Werte der Lichtstärkegradienten im ersten Fenster, um den Bereichsgradienten zu erzeugen.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der den Lichtstärkegradienten erzeugende Schritt folgende Schritte einschließt: – Vergleichen des Bereichsgradientenwerts GS(i, j) mit einem vorbestimmten Gradientenschwellenwert GT, um ein Vergleichssignal zu erzeugen, das anzeigt, ob ein aktuelles, in der aktuellen Pixelposition (i, j) im Eingangsbild befindliches Eingangspixel in der Nähe einer Kante in dem Eingangsbild liegt; – wenn das Vergleichssignal anzeigt, dass das aktuelle Eingangspixel nicht in der Nähe einer Kante liegt, Durchfürhren einer Schwellwertoperation, in Abhängigkeit von dem Vergleichssignal, mit dem Eingangspixelwert in der Position (i ,j) im Eingangsbild gegenüber einem vorbestimmten, festgelegten Graustufenschwellwert IT, um einen entsprechenden binären Ausgangswert in der Pixelposition (i, j) im ersten Ausgangsbild zu erhalten; und – wenn das Vergleichssignal anzeigt, dass das aktuelle Eingangspixel tatsächlich in der Nähe einer Kante liegt, Versetzen des entsprechenden binären Ausgangswerts in Abhängigkeit vom Vergleichssignal in einen ersten oder zweiten Zustand, wenn der aktuelle Pixelwert einen Durchschnittswert der maximalen bzw. minimalen Pixelwerte entweder übersteigt oder darunter liegt.
  5. Verfahren nach Anspruch 2 oder 4, dadurch gekennzeichnet, dass der Schritt zum Messen des Lichtstärkegradienten folgenden Schritt einschließt: – Erzeugen des Lichtstärkegradientenwerts für die aktuelle Pixelposition durch Verarbeiten des dritten Fensters der Eingangswerte durch einen Sobel Operator.
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass das dritte Fenster ein 3 × 3 Eingangspixelwerte-Fenster ist und der Sobel Operator die folgenden Gleichungen zur Anwendung bringt: GX(i,j) = L(i+1,j–1) + 2L(i+1,j) + L(i+1,j+1) – L(i–1,j–1) – 2L(i–1,j) – L(i–1,j+1) GY(i,j) = L(i–1,j+1) + 2L(i,j+1) + L(i+1,j+1) – L(i–1,j–1) – 2L(i,j–1) – L(i+1,j–1) und G(i,j) = |GX(i, j)| + |GY(i,j)|wobei L(i,j) ein Eingangspixelwert, in Luminanz, für die Pixelposition (i,j) im Eingangsbild ist.
  7. Verfahren nach Anspruch 4, gekennzeichnet durch folgende Schritte: – Erzeugen, in Abhängigkeit von dem Vergleichssignal und dem Pixelwert (Lc) in der aktuellen Pixelposition (i,j), eines modifizierten Graustufen-Ausgangspixelwerts in Position (i,j) in einem zweiten Ausgangsbild, wobei der modifizierte Graustufen-Ausgangspixelwert dem Pixelwert Lc gleichgesetzt wird, wenn das Vergleichssignal anzeigt, dass das aktuelle Eingangspixel nicht in der Nähe der Kante in dem Eingangsbild liegt, oder wobei der modifizierte Graustufen-Ausgangspixelwert einem vorbestimmten Wert gleichgesetzt wird, der größer oder kleiner als der Schwellenwert IT ist, wenn der Pixelwert Lc größer bzw. kleiner als der Schwellenwert IT ist, falls das Vergleichssignal anzeigt, dass das aktuelle Eingangspixel tatsächlich in der Nähe der Kante liegt; und – Durchführen einer Schwellwertoperation mit dem modifizierten Graustufen-Ausgangspixelwert, gegenüber dem Schwellenwert IT, um einen entsprechenden zweiten binären Ausgangspixelwert in einer Pixelposition (i,j) in einem zweiten Ausgangsbild zu erhalten.
  8. Vorrichtung zur Schwellwertverarbeitung eines Graustufen-Eingangsbildes in ein erstes Ausgangsbild, wobei das Eingangsbild aus Eingangspixeln besteht, von denen jedes einen zugeordneten Multibit-Graustufenpixelwert aufweist, und wobei das erste Ausgangsbild aus Pixeln besteht, von denen jedes einen entsprechenden, zugeordneten Ausgangspixelwert aufweist, dadurch gekennzeichnet, dass die Vorrichtung die Schritte nach den Ansprüchen 1 – 7 verwendet.
DE69533054T 1994-11-10 1995-10-30 Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften Expired - Lifetime DE69533054T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/338,051 US5583659A (en) 1994-11-10 1994-11-10 Multi-windowing technique for thresholding an image using local image properties
US338051 1994-11-10

Publications (2)

Publication Number Publication Date
DE69533054D1 DE69533054D1 (de) 2004-06-24
DE69533054T2 true DE69533054T2 (de) 2005-05-12

Family

ID=23323205

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69533054T Expired - Lifetime DE69533054T2 (de) 1994-11-10 1995-10-30 Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften

Country Status (4)

Country Link
US (1) US5583659A (de)
EP (1) EP0712094B1 (de)
JP (1) JPH08214162A (de)
DE (1) DE69533054T2 (de)

Families Citing this family (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3037432B2 (ja) * 1993-11-01 2000-04-24 カドラックス・インク 光波オーブンによる食物調理方法および調理装置
ES2140825T3 (es) * 1995-01-31 2000-03-01 United Parcel Service Inc Procedimiento y aparato para separar el primer plano del fondo en imagenes que contienen texto.
KR0181129B1 (ko) * 1995-06-17 1999-05-01 김광호 화상처리장치의 화소 이치화 장치 및 방법
US6256529B1 (en) 1995-07-26 2001-07-03 Burdette Medical Systems, Inc. Virtual reality 3D visualization for surgical procedures
US5979763A (en) * 1995-10-13 1999-11-09 Metanetics Corporation Sub-pixel dataform reader with dynamic noise margins
DE19549216C2 (de) * 1995-12-30 1999-09-09 Fraunhofer Ges Forschung Verfahren zur Bildauswertung
US5923776A (en) * 1996-05-23 1999-07-13 The United States Of America As Represented By The Secretary Of The Navy Object extraction in images
US5861616A (en) * 1996-10-01 1999-01-19 Mustek Systems, Inc. Method and device for recognizing a waveform of an analog signal
US5990956A (en) * 1996-12-30 1999-11-23 Daewoo Electronics, Inc. Method and apparatus for padding a video signal for shape adaptive transformation
US6157749A (en) * 1997-03-05 2000-12-05 Canon Kabushiki Kaisha Image processing apparatus and method, and storing medium
US5859891A (en) * 1997-03-07 1999-01-12 Hibbard; Lyn Autosegmentation/autocontouring system and method for use with three-dimensional radiation therapy treatment planning
US6016960A (en) * 1997-07-08 2000-01-25 Intermec Ip Corporation Rule based method and apparatus for processing reflectance signals from machine-readable symbols or images
US6012640A (en) * 1997-07-08 2000-01-11 Intermec Ip Corporation Rule based and fuzzy logic method and apparatus for processing reflectance signals from machine-readable symbols or images
US6115377A (en) * 1997-08-21 2000-09-05 Eastman Kodak Company Digital synchronization of multiple asynchronous data sources
US6075622A (en) * 1997-10-14 2000-06-13 Eastman Kodak Company Duplex document scanner for processing multiplexed images with a single data path
AU4318499A (en) 1997-11-24 1999-12-13 Burdette Medical Systems, Inc. Real time brachytherapy spatial registration and visualization system
US6044179A (en) * 1997-11-26 2000-03-28 Eastman Kodak Company Document image thresholding using foreground and background clustering
WO1999042807A1 (fr) 1998-02-19 1999-08-26 Asahi Glass Company Ltd. Procede et appareil de test de bris de glace, procede d'imagerie correspondant, et procede de traitement de signaux d'images
US6160913A (en) * 1998-03-25 2000-12-12 Eastman Kodak Company Method and apparatus for digital halftone dots detection and removal in business documents
JP3345350B2 (ja) * 1998-05-27 2002-11-18 富士通株式会社 文書画像認識装置、その方法、及び記録媒体
DE69822608T2 (de) * 1998-05-28 2005-01-05 International Business Machines Corp. Binarisierungsverfahren in einem Zeichenerkennungssystem
US6227725B1 (en) * 1998-08-18 2001-05-08 Seiko Epson Corporation Text enhancement for color and gray-scale documents
US6317223B1 (en) * 1998-12-14 2001-11-13 Eastman Kodak Company Image processing system for reducing vertically disposed patterns on images produced by scanning
US6282326B1 (en) * 1998-12-14 2001-08-28 Eastman Kodak Company Artifact removal technique for skew corrected images
US6343159B1 (en) * 1998-12-23 2002-01-29 Xerox Corporation Method and apparatus for modeling and reconstruction of halftoned images
JP4018310B2 (ja) * 1999-04-21 2007-12-05 株式会社リコー 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体
JP4094789B2 (ja) * 1999-11-26 2008-06-04 富士通株式会社 画像処理装置及び画像処理方法
US7221780B1 (en) * 2000-06-02 2007-05-22 Sony Corporation System and method for human face detection in color graphics images
US6701009B1 (en) * 2000-06-06 2004-03-02 Sharp Laboratories Of America, Inc. Method of separated color foreground and background pixel improvement
JP3619757B2 (ja) * 2000-07-17 2005-02-16 三洋電機株式会社 クリップ回路及びそれを用いた画像処理装置
US6621595B1 (en) * 2000-11-01 2003-09-16 Hewlett-Packard Development Company, L.P. System and method for enhancing scanned document images for color printing
US7043080B1 (en) * 2000-11-21 2006-05-09 Sharp Laboratories Of America, Inc. Methods and systems for text detection in mixed-context documents using local geometric signatures
US6806980B2 (en) * 2000-12-28 2004-10-19 Xerox Corporation Adaptive illumination correction of scanned images
US6924909B2 (en) * 2001-02-20 2005-08-02 Eastman Kodak Company High-speed scanner having image processing for improving the color reproduction and visual appearance thereof
US6823081B2 (en) 2001-04-30 2004-11-23 Eastman Kodak Company Generation of a color dropout function for use in electronic color dropout
CN1184796C (zh) * 2001-07-26 2005-01-12 佳能株式会社 图象处理方法和设备以及图象处理系统
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US7136515B2 (en) * 2001-09-13 2006-11-14 Intel Corporation Method and apparatus for providing a binary fingerprint image
US7203900B2 (en) * 2001-09-14 2007-04-10 Canon Kabushiki Kaisha Apparatus and method for inserting blank document pages in a print layout application
JP4532798B2 (ja) * 2001-09-14 2010-08-25 キヤノン株式会社 文書処理装置及び方法
US20050002566A1 (en) * 2001-10-11 2005-01-06 Riccardo Di Federico Method and apparatus for discriminating between different regions of an image
WO2003039370A1 (en) 2001-11-05 2003-05-15 Computerized Medical Systems, Inc. Apparatus and method for registration, guidance, and targeting of external beam radiation therapy
US7031543B2 (en) * 2002-01-02 2006-04-18 Xerox Corporation Grayscale image de-speckle algorithm
US8103104B2 (en) * 2002-01-11 2012-01-24 Hewlett-Packard Development Company, L.P. Text extraction and its application to compound document image compression
US6970606B2 (en) * 2002-01-16 2005-11-29 Eastman Kodak Company Automatic image quality evaluation and correction technique for digitized and thresholded document images
US7233695B2 (en) * 2002-07-01 2007-06-19 Xerox Corporation Scan color conversion method
US7308136B2 (en) * 2002-07-01 2007-12-11 Xerox Corporation Weak edge repositioning in a MRC segmentor
US7236641B2 (en) * 2002-07-01 2007-06-26 Xerox Corporation Page background detection and neutrality on scanned documents
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
US7227988B2 (en) * 2002-07-01 2007-06-05 Xerox Corporation Prioritized PDL segmentation producing two bit selector
US7324120B2 (en) * 2002-07-01 2008-01-29 Xerox Corporation Segmentation method and system for scanned documents
US7200263B2 (en) * 2002-07-01 2007-04-03 Xerox Corporation Background suppression and color adjustment method
US7031518B2 (en) * 2002-07-01 2006-04-18 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US6983076B2 (en) * 2002-07-01 2006-01-03 Xerox Corporation Control system for digital de-screening of documents
US7218418B2 (en) * 2002-07-01 2007-05-15 Xerox Corporation Digital de-screening of documents
US7375856B2 (en) * 2002-07-01 2008-05-20 Xerox Corporation Halftone screen frequency and magnitude estimation for digital descreening of documents
US7456982B2 (en) * 2002-07-01 2008-11-25 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents
US7242802B2 (en) * 2002-07-01 2007-07-10 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US7433084B2 (en) * 2002-07-01 2008-10-07 Xerox Corporation Digital de-screening technique for scanned documents
US7356183B2 (en) * 2002-07-01 2008-04-08 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents
US7269294B2 (en) * 2002-07-01 2007-09-11 Xerox Corporation Foreground erosion method and system for Multiple Raster Content (MRC) representation of documents
US7382489B2 (en) * 2002-07-01 2008-06-03 Xerox Corporation Efficient interpolation technique using programmable node spacing
US7187800B2 (en) 2002-08-02 2007-03-06 Computerized Medical Systems, Inc. Method and apparatus for image segmentation using Jensen-Shannon divergence and Jensen-Renyi divergence
US7570394B2 (en) * 2003-03-27 2009-08-04 Xerox Corporation System for determining the size of an original image, such as in a digital copier
TWI366156B (en) * 2003-07-01 2012-06-11 Xerox Corp Method and system for thinning or eroding a gray image of an input image defined by a plurality of pixels
US7532363B2 (en) 2003-07-01 2009-05-12 Xerox Corporation Apparatus and methods for de-screening scanned documents
US7366357B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Systems and methods for adjusting image data to form highly compressible image planes
US7379587B2 (en) * 2004-02-12 2008-05-27 Xerox Corporation Systems and methods for identifying regions within an image having similar continuity values
US7366746B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Finite impulse response filter method and apparatus
US7343046B2 (en) * 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
US7302116B2 (en) * 2004-02-12 2007-11-27 Xerox Corporation Method and apparatus for reduced size image
US7403661B2 (en) * 2004-02-12 2008-07-22 Xerox Corporation Systems and methods for generating high compression image data files having multiple foreground planes
US7365882B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Halftone screen frequency and magnitude estimation for digital descreening of documents
US7386166B2 (en) * 2004-02-12 2008-06-10 Xerox Corporation Systems and methods for connecting regions image data having similar characteristics
CN100347722C (zh) * 2004-12-24 2007-11-07 佳能株式会社 用于确定文本二值化阈值的方法和设备
US7400776B2 (en) * 2005-01-10 2008-07-15 International Business Machines Corporation Visual enhancement for reduction of visual noise in a text field
US20060247863A1 (en) * 2005-04-28 2006-11-02 Bui Huy A Optimizing maldi mass spectrometer operation by sample plate image analysis
US8098907B2 (en) * 2005-07-01 2012-01-17 Siemens Corporation Method and system for local adaptive detection of microaneurysms in digital fundus images
US7620260B2 (en) * 2005-11-10 2009-11-17 Samsung Electronics Co., Ltd. Line thinning method and system for grayscale image
US20070146794A1 (en) * 2005-12-23 2007-06-28 Lexmark International, Inc. Descreening and detail enhancement for scanned documents
US20070253040A1 (en) * 2006-04-28 2007-11-01 Eastman Kodak Company Color scanning to enhance bitonal image
US7949162B2 (en) * 2006-08-14 2011-05-24 Siemens Medical Solutions Usa, Inc. System and method for solid component evaluation in mixed ground glass nodules
WO2008060124A2 (en) * 2006-11-17 2008-05-22 Silicon Communications Technology Co., Ltd. Low power image sensor adjusting reference voltage automatically and optical pointing device comprising the same
JP4424386B2 (ja) * 2007-08-09 2010-03-03 三菱電機株式会社 画像表示装置、画像処理装置および画像処理方法
US8111918B2 (en) * 2008-10-20 2012-02-07 Xerox Corporation Segmentation for three-layer mixed raster content images
US8885967B2 (en) * 2009-01-19 2014-11-11 Csr Technology Inc. Method and apparatus for content adaptive sharpness enhancement
US8503814B2 (en) * 2009-01-19 2013-08-06 Csr Technology Inc. Method and apparatus for spectrum estimation
US8289568B1 (en) 2009-02-19 2012-10-16 Hewlett-Packard Development Company, L.P. Printing using variable pixel-replication factors
US8254694B2 (en) * 2009-06-08 2012-08-28 Xerox Corporation Thin line detection in scanned image data
US8634630B2 (en) * 2010-10-07 2014-01-21 Texas Instruments Incorporated Method and apparatus for enhancing representations of micro-calcifications in a digital mammogram image
US8670611B2 (en) 2011-10-24 2014-03-11 International Business Machines Corporation Background understanding in video data
WO2013067025A1 (en) * 2011-10-31 2013-05-10 Volcano Corporation Devices, systems, and methods for controlling field of view in imaging systems
US9147262B1 (en) * 2014-08-25 2015-09-29 Xerox Corporation Methods and systems for image processing
US10237447B2 (en) * 2015-06-29 2019-03-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
CN108573469A (zh) * 2017-03-07 2018-09-25 富士通株式会社 图像处理装置和方法
JP7149047B2 (ja) * 2018-09-27 2022-10-06 キヤノン電子株式会社 画像処理装置、画像処理装置の制御方法、及びプログラム
CN111062910B (zh) * 2019-11-13 2023-06-20 易思维(杭州)科技有限公司 局部阈值分割方法及缺陷检测方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5537092A (en) * 1978-09-05 1980-03-14 Ibm Mode switch for setting threshold value
NL8105256A (nl) * 1981-11-20 1983-06-16 Philips Nv Inrichting voor het dynamisch instellen van een discriminatiedrempel zwart/wit bij het bewerken van beelden met grijsheidswaarden.
US4468704A (en) * 1982-10-28 1984-08-28 Xerox Corporation Adaptive thresholder
US4709274A (en) * 1983-08-29 1987-11-24 Canon Kabushiki Kaisha Image processing apparatus
JPH0743773B2 (ja) * 1986-02-27 1995-05-15 キヤノン株式会社 画像処理装置
AU583202B2 (en) * 1987-02-06 1989-04-20 Fujitsu Limited Method and apparatus for extracting pattern contours in image processing
US5025480A (en) * 1987-03-23 1991-06-18 Eastman Kodak Company Background referencing
US4868670A (en) * 1987-07-24 1989-09-19 Eastman Kodak Company Apparatus and method for improving the compressibility of an enhanced image through use of a momentarily varying threshold level
DE68918886T2 (de) * 1988-04-08 1995-06-01 Dainippon Screen Mfg Verfahren zur Gewinnung der Aussenlinie eines Objektes in einem Bild.
JPH0668763B2 (ja) * 1988-04-11 1994-08-31 株式会社イーゼル 画像処理方法
US5086484A (en) * 1988-08-24 1992-02-04 Canon Kabushiki Kaisha Image processing apparatus with fixed or variable threshold
US5055944A (en) * 1988-11-15 1991-10-08 Mita Industrial Co., Ltd. Image signal processing apparatus
JPH02162475A (ja) * 1988-12-15 1990-06-22 Dainippon Screen Mfg Co Ltd 画像輪郭修正方法
US4912569A (en) * 1989-01-24 1990-03-27 Eastman Kodak Company Method for thresholding an image signal
US4918543A (en) * 1989-01-24 1990-04-17 Eastman Kodak Company Apparatus for thresholding an image signal
US4908875A (en) * 1989-03-21 1990-03-13 Hughes Aircraft Company Adaptive thresholding technique
US5153925A (en) * 1989-04-27 1992-10-06 Canon Kabushiki Kaisha Image processing apparatus
US5315405A (en) * 1989-08-29 1994-05-24 Mutoh Industries Ltd. Binary circuit of scanner read image data
US5034990A (en) * 1989-09-05 1991-07-23 Eastman Kodak Company Edge enhancement error diffusion thresholding for document images
US5070413A (en) * 1989-10-10 1991-12-03 Eastman Kodak Company Color digital halftoning with vector error diffusion
CA2028092C (en) * 1989-10-23 1996-08-06 Yuji Tanaka Binary image processing apparatus
US5150223A (en) * 1989-11-30 1992-09-22 Eastman Kodak Company Copier with single pass auto exposure
US5201014A (en) * 1990-02-08 1993-04-06 Hewlett-Packard Company Method and apparatus for establishing threshold level in a binary mode document scanner
US5268773A (en) * 1990-03-30 1993-12-07 Samsung Electronics Co., Ltd. Document image signal processor having an adaptive threshold
JP2574923B2 (ja) * 1990-04-10 1997-01-22 大日本スクリーン製造株式会社 輪郭強調方法および画像処理装置
JP3038816B2 (ja) * 1990-06-27 2000-05-08 株式会社リコー 画像処理装置
JPH04271662A (ja) * 1991-02-27 1992-09-28 Nec Corp 画像領域判定装置
EP0505200A3 (en) * 1991-03-20 1993-12-01 Fujitsu Ltd Radiographic image processing method wherein small variation of density is selectively made clear
US5271064A (en) * 1991-06-14 1993-12-14 University Of Cincinnati Apparatus and method for smoothing regions and enhancing edges in gray scale images
US5224177A (en) * 1991-10-31 1993-06-29 The University Of Chicago High quality film image correction and duplication method and system
EP0548571A1 (de) * 1991-11-25 1993-06-30 Eastman Kodak Company System und Verfahren für bidirektionale adaptive Schwellenwertanwendung
US5200831A (en) * 1992-06-05 1993-04-06 Eastman Kodak Company Method and arrangement for locally switching gray dot types to reproduce an image with gray level printing
US5450531A (en) * 1992-11-30 1995-09-12 Eastman Kodak Company Resolution enhancement system for combined binary and gray scale halftone images
US5452367A (en) * 1993-11-29 1995-09-19 Arch Development Corporation Automated method and system for the segmentation of medical images

Also Published As

Publication number Publication date
JPH08214162A (ja) 1996-08-20
US5583659A (en) 1996-12-10
EP0712094A3 (de) 1996-07-10
EP0712094A2 (de) 1996-05-15
DE69533054D1 (de) 2004-06-24
EP0712094B1 (de) 2004-05-19

Similar Documents

Publication Publication Date Title
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE4445386C1 (de) Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
DE69828909T2 (de) Neue perzeptive lokale gradientenbasierte gratbestimmung
DE60308739T2 (de) Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik
DE69736938T2 (de) Detektion und Wiedergabe von Text in gerasterten Bildbereichen
DE69728482T2 (de) Zweidimensionaler Codeleser
DE602004005358T2 (de) Objektdetektion in bildern
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
DE3633743C2 (de)
DE60111756T2 (de) Verfahren zum verbessern der kompressionsfähigkeit und der bildqualität von abgetasteten dokumenten
DE69734855T2 (de) Vorrichtung und Verfahren zur Extraktion eines Objektes in einem Bild
DE602004002618T2 (de) Verfahren und System zur Kantenhervorhebung
DE60008486T2 (de) Verfahren zur Himmelserkennung in Bildern
DE19814075B4 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
DE69822608T2 (de) Binarisierungsverfahren in einem Zeichenerkennungssystem
DE60113564T2 (de) Bildverarbeitungseinrichtung und Mustererkennungsvorrichtung, bei der die Bildverarbeitungseinrichtung verwendet wird
DE60020038T2 (de) Verfahren zum Verarbeiten eines numerischen Bildes
DE2757456C2 (de)
KR100207426B1 (ko) 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
EP2028605A1 (de) Detektionsverfahren für symmetrische Muster
DE60302946T2 (de) Bildsegmentierungsverfahren und -vorrichtung zur MRC-basierten Darstellung von Dokumenten
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition