DE19531392C1 - Handwritten character graphical representation system - Google Patents
Handwritten character graphical representation systemInfo
- Publication number
- DE19531392C1 DE19531392C1 DE19531392A DE19531392A DE19531392C1 DE 19531392 C1 DE19531392 C1 DE 19531392C1 DE 19531392 A DE19531392 A DE 19531392A DE 19531392 A DE19531392 A DE 19531392A DE 19531392 C1 DE19531392 C1 DE 19531392C1
- Authority
- DE
- Germany
- Prior art keywords
- contour
- image
- lines
- line
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/168—Smoothing or thinning of the pattern; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
Description
Die vorliegende Erfindung betrifft das Gebiet der automatischen Bilderkennung, insbesondere die Erkennung von Schriften, vor allem von handgeschriebenen Wörtern und Buchstaben.The present invention relates to the field of automatic image recognition, especially the recognition of fonts, especially handwritten ones Words and letters.
Allgemein ist die Erkennung von handgeschriebenen Schriften eine schwierigere Aufgabe, als die Erkennung von Maschinenschrift. In beiden Fällen geht es allerdings um die Klassifizierung von Objekten mit bedeutungsvollen Regelmäßigkeiten in einer komplexen Umgebung. Generell dabei auftretende Probleme betreffen die erforderliche Speicherkapazität und die erforderliche Rechenzeit, da in einem typischen automatischen Zeichenerkennungssystem eine Referenzbibliothek sämtlicher zu erwartender Zeichen angelegt wird, mit deren Inhalt zu erkennende Zeichen verglichen werden.In general, recognizing handwritten fonts is more difficult Task than typing recognition. In both cases it works however, the classification of objects with meaningful Regularities in a complex environment. Generally occurring Problems concern the required storage capacity and the required Computing time, since in a typical automatic character recognition system Reference library of all expected characters is created with their Characters to be recognized are compared.
Zur Lösung dieses Problems sind bisher verschiedene Ansätze vorgeschlagen worden, so unter anderem die Verwendung neuronaler Netze, direkte Musterextraktion und Matrixverfahren. Eine kurze Übersicht über das Gesamtgebiet ist in dem Artikel "Document analysis - from pixels to contents" Proceedings of the IEEE, Vol. 18, No. 7, Juli 1992, S. 1101-1118, zu finden.Various approaches have been proposed to solve this problem among other things, the use of neural networks, direct Sample extraction and matrix processes. A brief overview of the entire area is in the article "Document analysis - from pixels to contents" Proceedings of the IEEE, Vol. 18, No. 7, July 1992, pp. 1101-1118.
Es ist auch bereits bekannt, nicht unmittelbar von der Binärdarstellung der Bildvorlage, sondern von einer Konturbeschreibung auszugehen. Eine solche Konturbeschreibung ist z. B. aus dem Artikel "General data structure for image analyses based on a description of connected components", computing 42, S. 17-34, (1989) bekannt. Aus diesem Dokument ist auch bereits bekannt, die Konturlinien durch linienorientierte Bildprimitive, d. h. durch Polygone, zu approximieren.It is also already known, not directly from the binary representation of the Image template, but to assume a contour description. Such Contour description is e.g. B. from the article "General data structure for image analyzes based on a description of connected components ", computing 42, p. 17-34, (1989). The contour lines are also known from this document through line-oriented primitives, d. H. using polygons to approximate.
Aus der Druckschrift JAKUB SEGEN "Model Learning and Recognition of Nonrigid Objects", IEEE 597-602 (1989) ist bereits die Repräsentation zweidimensionaler Objekte durch eine Menge lokaler Features bekannt. Als lokales Feature wird ein lokales Extremum der Krümmung einer zweidimensionalen Kurve herangezogen. Andere Typen lokaler Features sind gemäß diesem Dokument Wendepunkte, gerade Linien und Kreissegmente. Hiervon ausgehend wird vorgeschlagen, eine Hierarchie von Gestaltprimitiven zu konstruieren, mit dem Ziel, allgemeine Formen durch eine Menge von Beziehungen zwischen lokalen Features zu charakterisieren.From the publication JAKUB SEGEN "Model Learning and Recognition of Nonrigid Objects ", IEEE 597-602 (1989), the representation is already two-dimensional Objects known by a lot of local features. As a local feature, a local extremum of the curvature of a two-dimensional curve. According to this document, other types of local features are turning points, straight lines and segments of circles. Proceeding from this, it is proposed that To construct hierarchy of form primitives, with the aim of general forms characterized by a lot of relationships between local features.
Die Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen anzugeben, wobei jeder Graph aus Knoten und Linien, z. B. repräsentiert als Polygonzüge, besteht.The object of the present invention is to provide a method for producing a Specify graph representation of image templates, with each graph consisting of nodes and lines, e.g. B. represents as polygons.
Diese Aufgabe wird durch die Merkmale des Patentanspruchs 1 gelöst.This object is achieved by the features of patent claim 1.
Die Erfindung ermöglicht die besonders schnelle und robuste Erzeugung einer strukturellen Repräsentation der Bildvorlage.The invention enables the particularly rapid and robust generation of a structural representation of the image template.
Weitere vorteilhafte Ausbildungen der Erfindung sind in den Unteransprüchen sowie der Beschreibung und den Zeichnungen zu entnehmen.Further advantageous developments of the invention are in the subclaims and from the description and the drawings.
Das erfindungsgemäße Verfahren ist vorzugsweise Bestandteil eines Systems, bei dem ausgehend von einem durch einen optischen Scanner erzeugten Abbild der Bildvorlage und der nachfolgenden Erzeugung eines Binärbildes der Bildvorlage bei verschiedenen Abstraktionsstufen eine Bildbearbeitung erfolgt. Ein solches System wird z. B. in automatischen Anschriftenlesern oder Beleglesern eingesetzt.The method according to the invention is preferably part of a system based on an image generated by an optical scanner Image template and the subsequent generation of a binary image of the image template image processing takes place at different levels of abstraction. Such a system z. B. used in automatic address readers or document readers.
Das Verfahren wird vorzugsweise in einem System verwendet, das aus verschiedenen Modulen besteht. Die wesentlichen Module betreffen dabei Bildvorverarbeitung, Bildabstrahierung, Bestimmung von Graphmerkmalen, Filterung von Erkennungsvorschlägen aus einer Referenzbibliothek, die eigentliche Zeichenerkennung und Auswertung der von der Zeichenerkennung gelieferten Wortvorschlagslisten, wobei Wortglaubwürdigkeiten zugeordnet werden.The method is preferably used in a system consisting of different modules. The main modules concern Image preprocessing, image radiation, determination of graph features, Filtering recognition suggestions from a reference library, the actual one Character recognition and evaluation of those supplied by the character recognition Word suggestion lists, whereby word credibilities are assigned.
Grundsätzlich ist das erfindungsgemäße Verfahren generell zur strukturellen Bilddatenreduktion und zur Bildspeicherung geeignet.Basically, the method according to the invention is generally structural Image data reduction and suitable for image storage.
Im folgenden wird die Erfindung anhand von Zeichnungen genauer erläutert.The invention is explained in more detail below with reference to drawings.
Es zeigen:Show it:
Fig. 1 eine Modulübersicht eines Systems zur Schrifterkennung; Fig. 1 is a module overview of a system for character recognition;
Fig. 2 ein typisches Binärbild; Fig. 2 shows a typical binary image;
Fig. 3 die Beschreibung eines Binärbildes durch Linien und Knotengebiete; Fig. 3, the description of a binary image by lines and nodes areas;
Fig. 4 die durch Konturcodierung repräsentierte geometrische Grenzlinie des Binärbildes gem. Fig. 2; Fig. 4 represented by the shape coding geometric boundary line of the binary image gem. Fig. 2;
Fig. 5 zusammengefaßte Linien und Knotengebiete gem. Fig. 4; Fig. 5 summarized lines and node areas acc. Fig. 4;
Fig. 6 die Linien und Knotengebiete der Linienrepräsentation eines Binär bildes und Linien und Knoten einer entsprechenden Graphre präsentation; Figure 6 illustrates the presentation lines and nodes areas of the line representation of a binary image and lines and a corresponding node Graphre.
Fig. 7 die Struktur einer Graphmenge; FIG. 7 shows the structure of a graph quantity;
Fig. 8 das Verfahren zur Maximalpunktfindung einer Kontur; Fig. 8, the method for finding the maximum point of a contour;
Fig. 9 die Beziehung zwischen Maximalpunkten und Polygonapproximation einer Kontur. Fig. 9 shows the relationship between maximal points and a contour polygon approximation.
In Fig. 1 ist eine Übersicht über die verschiedenen Prozeßmodule eines Schrifterkennungssystems dargestellt. Erkennbar ist, daß es sich bei der Schrifterkennung um einen Multilevelprozess handelt, bei dem ausgehend von dem durch eine optische Abtasteinrichtung und einer anschließenden Bildvorverarbeitung gelieferten Binärbild eines Schriftbildes über verschie dene Verarbeitungsstufen ein Teilwörterbuch mit Glaubwürdigkeiten zuge ordneter Bedeutungsklassen erzeugt wird. Ein System nach Fig. 1 wird vorzugsweise als echtzeitfähiges Script-Worterkennungssystem verwendet. Dabei bedeutet "Scrip" alle Ausprägungen von freier Handschrift, d. h. von einer Handblockschrift mit isolierten "Kleinbuchstaben" über die verschiedenen Mischformen bis hin zu vollständig gebundener Schreib schrift sowie handschriftliche Maschinenschriftfonds und verklebte, d. h. mit üblichen Schriftsegmentierungsverfahren nicht segmentierbare Maschi nenschriftfonds. Grundsätzlich ist jedoch dieses System auch für die Erkennung von anderen Schriftarten und andere Anwendungsgebiete der Bilderkennung, wie z. B. flow-chart-Analyse, geeignet.In Fig. 1 an overview is shown of a handwriting recognition system through the different process modules. It can be seen that the character recognition is a multilevel process in which, based on the binary image of a typeface provided by an optical scanning device and a subsequent image preprocessing, a partial dictionary with credibility of assigned meaning classes is generated via various processing stages. A system according to FIG. 1 is preferably used as a real-time script recognition system. "Scrip" means all forms of free handwriting, that is, from handwriting with isolated "lowercase letters" to the various mixed forms up to fully bound handwriting as well as handwritten typewriting funds and glued typewriting funds that are not segmentable with conventional script segmentation methods. Basically, however, this system is also for the recognition of other fonts and other areas of application of image recognition, such as. B. flow chart analysis, suitable.
Ausgehend von dem von der optischen Abtastvorrichtung gelieferten Abbild 10 erfolgt in der Bildvorverarbeitung 12 eine Rauschverringerung, bei der das Binärbild geglättet wird. Bei Schriftbildern erfolgt üblicherweise eine Identifizierung und Isolierung von signifikanten Layout-Elementen, wie z. B. Adreßzeichen. Anschließend wird eine Abstraktion des Bildes 14 er zeugt, vorzugsweise erfolgt eine Linienrepräsentation des Bildes 15, anschließend eine Graphrepräsentation 16 sowie eine Normierung auf der Graphebene 17.On the basis of the image 10 supplied by the optical scanning device, noise is reduced in the image preprocessing 12 , in which the binary image is smoothed. Typefaces typically identify and isolate significant layout elements, such as: B. Address characters. An abstraction of the image 14 is then generated, preferably a line representation of the image 15, then a graph representation 16 and a normalization on the graph plane 17 .
In einem weiteren Schritt werden die globalen Graphmerkmale 18 be stimmt; insbesondere erfolgt eine Partitionierung der Graphen 19 und eine merkmalsgesteuerte Reduktion der aus einem Gesamtwörterbuch 22 gewonnenen Wörter mit nachfolgender Filterung 24, die mittels eines Teil wörterbuchs 26 gesteuert wird.In a further step, the global graph features 18 are determined ; in particular, the graphs 19 are partitioned and a feature-controlled reduction of the words obtained from a complete dictionary 22 with subsequent filtering 24 , which is controlled by means of a partial dictionary 26 .
Bei der eigentlichen Zeichenerkennung 28 werden Bedeutungsklassen gefunden, die durch ein oder mehrere Graphmodelle repräsentiert werden, denen in der Auswertung 34 Wortglaubwürdigkeiten zugeordnet werden. Das Ergebnis des Gesamtprozesses ist ein Teilwörterbuch, mit den einzel nen Wörtern zugeordneten Glaubwürdigkeiten.In the actual character recognition 28 meaning classes are found, which are represented by one or more graph models, to which 34 word credibilities are assigned in the evaluation. The result of the overall process is a sub-dictionary with credibility assigned to the individual words.
Fig. 2 zeigt ein Binärbild einer handgeschriebenen Ziffer 4. In diesem Beispiel werden die Bildpunkte als quadratische Flächenelemente reprä sentiert, deren Kantenlänge die Einheitsmenge ist. Zur Beschreibung in einem kartesischen Koordinatensystem wird grundsätzlich zwischen den Eck- und Pixelkoordinaten unterschieden. Die Eckkoordinaten sind auf die geometrischen Grenzen der Bildpunkte ausgerichtet. Beispielsweise haben die vier Ecken des Bildpunktes in der linken unteren Ecke die Koordinaten E₁ = (0,0), E₂ = (1,0), E₃ = (1,1), E₄ = (0,1). Die Pixelkoordinaten indi zieren die einzelnen Bildpunkte. Z. B. hat der Bildpunkt in der linken unte ren Ecke die Koordinaten P = (0,0). Fig. 2 shows a binary image of a handwritten point 4. In this example, the pixels are represented as square surface elements, the edge length of which is the unit quantity. For a description in a Cartesian coordinate system, a basic distinction is made between the corner and pixel coordinates. The corner coordinates are aligned with the geometric limits of the pixels. For example, the four corners of the pixel in the lower left corner have the coordinates E₁ = (0.0), E₂ = (1.0), E₃ = (1.1), E₄ = (0.1). The pixel coordinates indicate the individual pixels. For example, the pixel in the lower left corner has the coordinates P = (0.0).
Binärbilder können durch Linien- und Knotengebiete beschrieben werden. Fig. 3 illustriert eine solche Beschreibung eines Binärbildes. Das Beispiel in Fig. 3 besteht aus zwei Liniengebieten 30, 31 und einem Knotengebiet 40. Jedes Liniengebiet weist eine Linienseite 1 und eine Linienseite 2 auf. Eine Linien- und Knotengebietrepräsentation kann man mittels einer Kon turcodierung erhalten, die auf dem Rasterchaincode (RC-Code) basiert und den Verlauf der geometrischen Grenzlinie eines Schwarzgebiets der Binär darstellung beschreibt. Diese Codierung beschreibt jedes zusammen hängende Schwarzgebiet durch eine Liste von Konturprimitiven, die die absoluten Richtungen right, up, left, down der Bildpunktkanten einer Kontur enthalten.Binary images can be described by line and node areas. Fig. 3 illustrates such a description of a binary image. The example in FIG. 3 consists of two line areas 30, 31 and a node area 40 . Each line area has a line side 1 and a line side 2 . A line and node area representation can be obtained using a contour coding that is based on the raster chain code (RC code) and describes the course of the geometric boundary line of a black area of the binary representation. This coding describes each connected black area by a list of contour primitives which contain the absolute directions right, up, left, down of the pixel edges of a contour.
Fig. 4 zeigt für das Binärbild der Fig. 3 die durch eine Konturcodierung erhaltene geometrische Grenzlinie. Bei einem beliebigen Bild ist es möglich, durch Ablaufen der Kontur die Flächen der einzelnen Schwarzgebiete, die Anzahl der konkaven und konvexen Ecken der Kontur und das umschrei bende Rechteck aller Schwarzgebiete zu bestimmen. FIG. 4 shows the geometric boundary line obtained by contour coding for the binary image of FIG. 3. With any image, it is possible to determine the areas of the individual black areas, the number of concave and convex corners of the contour and the circumscribing rectangle of all black areas by running the contour.
Zusammen mit lokalen Merkmalen der Kontur werden diese globalen Merkmale benutzt um Linienhypothesen zu bilden. Implizit sind nach der Bestimmung der Linienhypothesen die Knotengebiete schon bekannt und zwar als die Gebiete, die zu keiner Linie gehören.Together with local features of the contour, these become global Features used to form line hypotheses. Are implicit after the Determining the line hypotheses the node areas already known and as the areas that do not belong to any line.
Fig. 5 zeigt die zum Binärbild der Fig. 2 gehörenden Linien und Kno tengebiete. Generell wird durch das Bild eine komplexe, hierarchiche Struktur aus Knoten und Linien und gleichen Konturelementen reprä sentiert. Die oberste Hierarchieebene bildet eine Beschreibung der globalen Merkmale des jeweiligen Bildes. Bei der Implementierung in einer Datenver arbeitungsanlage ist von dieser Ebene ein Zugriff auf die nächsttiefere Hier archieebene, die der Knoten, vorgesehen. Für jeden Knoten existiert eine Zugriffsmöglichkeit auf diejenigen Linien, die von diesem Knoten ausgehen und die dritte Ebene der Hierarchie bilden. Von der Linie besteht über die Endkonturelemente Zugriff auf die gesamte Konturbeschreibung beider Seiten der Linie. In Fig. 3 sind die Endkonturelemente mit S11, S12, S21 und S22 für jede Linie bezeichnet. Fig. 5 shows the lines and knot areas belonging to the binary image of Fig. 2. The picture generally represents a complex, hierarchical structure of nodes and lines and the same contour elements. The top hierarchical level is a description of the global characteristics of the respective picture. When implementing in a data processing system, this level provides access to the next lower hierarchy level, that of the node. For each node there is an option to access the lines that start from this node and form the third level of the hierarchy. From the line there is access to the entire contour description of both sides of the line via the final contour elements. In Fig. 3, the end contour elements are designated S11, S12, S21 and S22 for each line.
Als globale Merkmale zur Bildbeschreibung werden vorzugsweise Höhe und Breite und mittlere Strichdicke des Wortbildes verwendet. Zur Be schreibung der Knoten werden X- und Y-Koordinaten des Umfangs schwerpunktes und die Ordnung des Knotens d. h. die Anzahl der von ihm ausgehenden Linien verwendet. Eine Linie wird durch die Merkmale der ersten und zweiten Konturseite der Linie, mittlere Länge der Linie und Richtungsinformation an den beiden Linienenden beschrieben. Ein Konturpunkt wird durch die Merkmale X- und Y-Position des Konturpunktes und Winkel der Tangente durch diesen Konturpunkt charakterisiert.Height and. Are preferred as global characteristics for the image description Width and medium line width of the word image used. To Be The nodes are written as X and Y coordinates of the circumference center of gravity and the order of the knot d. H. the number of it outgoing lines used. A line is characterized by the characteristics of the first and second contour side of the line, average length of the line and Direction information described at the two line ends. On The contour point is defined by the X and Y position of the contour point and angle of the tangent are characterized by this contour point.
In der oben beschriebenen Linienrepräsentation des Binärbildes wird dieses im wesentlichen durch Linien- und Knotengebiete und die Ver bindungsstruktur dieser Gebiete charakterisiert. Grundsätzlich läßt sich aus dieser Darstellung noch das Binärbild rekonstruieren. Für die Zeichener kennung ist jedoch eine kompaktere Beschreibung des Bildes wesentlich, bei dem die Knoten- und die Liniengebiete bzw. Konturen in geeigneter Weise zusammengefaßt werden. Dies geschieht durch eine Graphreprä sentation des Bildes. In the line representation of the binary image described above, this is essentially through line and node areas and the ver characterized the binding structure of these areas. Basically, it leaves out use this representation to reconstruct the binary image. For the artist however, a more compact description of the image is essential. in which the node and line areas or contours are more suitable Ways summarized. This is done using a graph representation sentation of the picture.
Fig. 6 zeigt einen Ausschnitt eines Schriftbildes in der Linienrepräsentation und in der daraus gewonnenen Graphrepräsentation. Es ist ersichtlich, daß aus Liniengebieten Polygone mit Stützpunkten und aus Knotengebieten Knoten mit vorzugsweise nur einem geometrischen Merkmal geworden sind. Fig. 6 shows a part of a document image in the line and in the representation obtained from this graph representation. It can be seen that line areas have become polygons with support points and node areas have become nodes with preferably only one geometric feature.
Fig. 7 illustriert die Struktur der Graphmenge. Die Graphmenge hat demnach eine komplexe hierarchiche Struktur bestehend aus Graphen 1 bis P, die jeweils aus Knoten und Linien bestehen, wobei letztere aus Punkten aufgebaut sind. Fig. 7 illustrates the structure of the graph quantity. The graph set accordingly has a complex hierarchical structure consisting of graphs 1 to P, each consisting of nodes and lines, the latter being made up of points.
Auf der obersten Hierarchiebene wird die Graphmenge durch das Merkmal der Dimension beschrieben, das vorzugsweise die Untermerkmale X- und Y-Koordinaten der Seiten des umschreibenden Rechtecks, Breite und Höhe des Rechtecks, Koordinaten des Rechteckmittelpunktes sowie die Gesamt länge der zur Graphmenge gehörenden Linien aufweist.On the top hierarchical level, the graph set is by the characteristic the dimension described, which preferably the sub-features X and Y coordinates of the sides of the circumscribing rectangle, width and height of the rectangle, coordinates of the center of the rectangle and the total length of the lines belonging to the graph set.
Ein Graph wird vorzugsweise durch die Merkmale: umschreibendes Rechteck des Graphen, relative Koordinaten innerhalb des umschreibenden Rechtecks der Graphmenge, Verbindungen zu Linien und Knoten und Verbindungen zu anderen Graphen charakterisiert.A graph is preferably characterized by the features: Rectangle of the graph, relative coordinates within the circumscribing one Rectangle of the graph set, connections to lines and nodes and Characterized connections to other graphs.
Ein Knoten wird vorzugsweise durch die Koordinaten des Knotenschwer punktes und die Verbindungen zu den abgehenden Linien beschrieben.A node is preferably made heavy by the coordinates of the node point and the connections to the outgoing lines are described.
Eine Linie weist folgende Merkmale auf: vorzugsweise umschreibendes Rechteck der Linie, akkumulierter Gesamtwinkel der Linie, relative Lage der Linie innerhalb des umschreibenden Rechtecks des Graphen, Winkel an den beiden Linienenden, Verbindung zu den beiden Endknoten der Linie sowie notwendigerweise die Verbindung zu den Punkten auf dieser Linie.A line has the following characteristics: preferably circumscribing Rectangle of the line, accumulated total angle of the line, relative position of the Line within the circumscribing rectangle of the graph, angle at the two line ends, connection to the two end nodes of the line as well necessarily the connection to the points on this line.
Ein Punkt wird vorzugsweise durch folgende Merkmale beschrieben: Ko ordinaten des Punktes, Abstand zum nächsten Punkt auf der Linie; bei Endpunkten Endausrichtung der Linie; bei Maximalpunkten Winkel der zugehörigen Projektionsachse.A point is preferably described by the following features: Ko ordinates of the point, distance to the next point on the line; at End points end alignment of the line; at maximum points angle of associated projection axis.
Beim Übergang zur Graphrepräsentation des Bildes werden die Linienge biete bzw. Konturen durch die beiden Endpunkte des Liniengebiets sowie gegebenenfalls durch einen oder mehrere Stützstellenpunkte approximiert. Wesentlich für das erfindungsgemäße Verfahren ist die Bestimmung dieser Stützstellenpunkte aus Maximalpunkten der Kontur, die durch Projektion auf vorgegebenen festen Achsen erhalten werden.At the transition to the graph representation of the image, the lines offer or contours through the two end points of the line area as well possibly approximated by one or more reference points. The determination of this is essential for the method according to the invention Support points from maximum points of the contour, which are generated by projection can be obtained on predetermined fixed axes.
In einer bevorzugten Ausführungsform der Erfindung werden die Stützstel lenpunkte aus der längeren der beiden Konturen eines Liniengebiets bestimmt. In einer weiteren bevorzugten Ausführungsform wird von einer Art Mittelachse des Liniengebiets ausgegangen.In a preferred embodiment of the invention, the support posts len points from the longer of the two contours of a line area certainly. In a further preferred embodiment, one Kind of central axis of the line area.
Im folgenden wird am Beispiel der Fig. 8 die Approximation durch Maxi malpunkte der Kontur genauer beschrieben. In Fig. 8 ist der Rand eines Schwarzgebietes vereinfacht als kontinuierliche Kurve dargestellt. Die Kurve wird generell auf eine vorgegebene Anzahl von Achsen mit jeweils unterschiedlichem Winkel α gegenüber einem vorgegebenen festen kartesi schen Koordinatensystem projiziert. Fig. 8 zeigt die Situation vereinfacht lediglich für eine Projektion auf die X-Achse. Es sei S der beliebige Start punkt für die Suche der Maxima. Dann wird die Kurve durchlaufen und dabei eine Projektion auf die X-Achse gebildet. Beim Durchlaufen der Kurve variiert der Wert für die Projektion entsprechend. In der resultierenden Projektionskurve auf die X-Achse werden die lokalen Maxima gesucht. In Fig. 8 erhält man an den Punkten A und C lokale Maxima, an den Punkten B und D lokale Minima.In the following, the approximation by maximum points of the contour is described in more detail using the example of FIG. 8. In FIG. 8, the edge of a black area is simplified as a continuous curve represented. The curve is generally projected onto a predetermined number of axes with different angles α relative to a predetermined fixed Cartesian coordinate system. Fig. 8 shows the situation simplifies only for a projection on the X-axis. Let S be the starting point for the search for the maxima. Then the curve is traversed and a projection is formed on the X axis. As the curve traverses, the value for the projection varies accordingly. The local maxima are sought in the resulting projection curve on the X axis. In FIG. 8, local maxima are obtained at points A and C, and local minima at points B and D.
Ein Minimum der Projektion auf eine X-Achse entspricht offensichtlich einem Maximum der Projektion zu einer Achse, die gegenüber der X-Achse um 180° gedreht ist.A minimum of the projection on an X axis obviously corresponds a maximum of the projection to an axis that is opposite to the x-axis is rotated by 180 °.
Eine Kontur weist üblicherweise kleine lokale Schwankungen auf. Um zu verhindern, daß dadurch zu viele unsignifikante Maxima bzw. Minima er halten werden, werden nur signifikante lokale Maxima gesucht. Als Krite rium hierfür wird auf beiden Seiten eines Maximums jeweils ein Minimum gefordert, das einen Mindestabstand zum Maximum besitzt. Beispielsweise wird in Fig. 8 das relative Maximum bei A nur dann als signifikantes Maxi mum akzeptiert, wenn die Differenzen a-d und a-b eine bestimmte Schwelle überschreiten. Entsprechend ist b nur dann ein Minimalpunkt, wenn sowohl a-b als auch c-b diese Schwelle überschreiten. A contour usually shows small local fluctuations. In order to prevent too many insignificant maxima or minima from being obtained as a result, only significant local maxima are sought. As a criterion for this, a minimum is required on both sides of a maximum that is at a minimum distance from the maximum. For example, in Fig. 8 the relative maximum at A is only accepted as a significant maximum if the differences ad and ab exceed a certain threshold. Accordingly, b is only a minimum point if both ab and cb exceed this threshold.
Allgemeiner kann auch die Bedingung bestimmt werden, daß ein Maximum dann signifikant ist, wenn es links und rechts von der Position des Ma ximums Projektionspunkte gibt, die mindestens um eine vorgegebene Diffe renz δ tieferliegen, und wenn es das höchste lokale Maximum in dieser Umgebung ist. Dies führt dazu, daß lokale Schwankungen der Kontur, die kleiner als der Wert δ sind, bei der Polygonapproximation ignoriert werden. Vorteilhaft ist es, δ proportional zur Wurzel der mittleren Strichdicke zu wählen.More generally, the condition that a maximum can be determined is significant if it is to the left and right of the position of the Ma ximums projection points are there that are at least around a predetermined difference renz δ lie lower and if it is the highest local maximum in this Environment is. This leads to local fluctuations in the contour are smaller than the value δ, at which polygon approximation are ignored. It is advantageous to add δ proportional to the root of the average line thickness choose.
Bei der praktischen Implementierung des Verfahrens braucht nicht immer überprüft zu werden, ob z. B. auf beiden Seiten eines Maximums ein Mini mum liegt. Tatsächlich genügt die Überprüfung der im Umlaufsinn nachfol genden Seite, da Minima- und Maximawerte abwechselnd auftreten. Aller dings müßten beim ersten potentiellen Maximalpunkt beide Seiten überprüft werden. Daher wird der erste gefundene potentielle Maximalpunkt ignoriert und die Suche nach Maximalpunkten nach einem ganzen Umlauf um die Kontur bis zum ersten tatsächlich gefundenen Maximalpunkt nach dem Anfangspunkt S weitergeführt werden.In the practical implementation of the method does not always need to be checked whether e.g. B. a mini on both sides of a maximum mum lies. In fact, it is sufficient to check the following in rotation side, since minimum and maximum values occur alternately. Everything However, both sides would have to be checked at the first potential maximum point will. Therefore, the first potential maximum point found is ignored and the search for maximum points after a full turn around the Contour to the first maximum point actually found after the Starting point S to be continued.
Statt auf die X-Achse, kann die Projektion natürlich auch auf Achsen belie biger Richtung erfolgen. Besonders vorteilhaft ist die Verwendung von mehreren Achsen der Neigung 0,45°, 90° und 135° bzw. ein System von acht festen Achsen mit jeweils gleicher Winkeldifferenz. Dadurch wird die Kontur als Folge von Maximalpunkten verschiedener Projektionsachsen beschrieben.Instead of the X-axis, the projection can of course also be on axes direction. The use of is particularly advantageous several axes of inclination 0.45 °, 90 ° and 135 ° or a system of eight fixed axes, each with the same angle difference. This will make the Contour as a result of maximum points of different projection axes described.
Fig. 9 zeigt den Zusammenhang zwischen den Maximalpunkten und der Polygonapproximation. Ersichtlicherweise wird durch Verbinden der auf der Kontur aufeinanderfolgenden Maximalpunkte ein Polygonzug erzeugt, der eine Approximation des ursprünglichen Bildes liefert. Fig. 9 shows the relationship between the maximum points and the polygon approximation. Obviously, by connecting the maximum points that follow one another on the contour, a polygon is generated, which provides an approximation of the original image.
Die gesamte Graphmenge wird aufbauend auf der Linienrepräsentation des Bildes rekursiv erzeugt. Hierzu wird zunächst eine neue Menge angelegt. Für alle noch nicht benutzten Knotengebiete gilt:The entire graph set is based on the line representation of the Image recursively. To do this, a new quantity is first created. The following applies to all node areas not yet used:
- 1) Beginne einen neuen Graphen.1) Start a new graph.
- 2) Lasse den Graphen rekursiv wachsen. Durchflute dabei die ver bundenen Linien- und Knotengebiete und lege innen entsprechende Linien und Knoten für die Graphbeschreibung an. Alle verbundenen Linien und Knoten werden= zu einem Graphen zusammengefaßt.2) Let the graph grow recursively. Flood through the ver bound line and node areas and lay appropriate inside Lines and nodes for the graph description. All connected Lines and nodes are combined = into a graph.
Im folgenden werden die Linien- und Knotengebiete als L-Linien und L-Knoten bezeichnet, die Entsprechungen der Graphenbeschreibung als G-Linien und G-Knoten.In the following the line and node areas are called L-lines and L-node, the equivalent of the graph description as G lines and G nodes.
Im Schritt 2) wird der neue Graph so lange erweitert, bis von allen verbun denen L-Linien bzw. L-Knoten eine korrespondierende Version von G-Linien und G-Knoten für den Graphen erzeugt worden ist:In step 2) the new graph is extended until all are connected which L-lines or L-nodes have a corresponding version of G-lines and G-nodes have been created for the graph:
- - Markiere, daß der aktuelle L-Knoten benutzt worden ist.- Mark that the current L node has been used.
- - Erzeuge den entsprechenden G-Knoten.- Create the corresponding G node.
Für alle L-Linien, die vom aktuellen L-Knoten ausgehen:For all L lines starting from the current L node:
- - Erzeuge eine entsprechende G-Linie, falls sie nicht schon von einem anderen G-Knoten aus erzeugt worden ist.- Create a corresponding G-line, if not already from one other G nodes has been created.
- - Erzeuge einen Verweis von der G-Linie auf den G-Knoten und umge kehrt.- Create a reference from the G line to the G node and vice versa returns.
Für alle L-Linien, die vom aktuellen L-Knoten ausgehen:For all L lines starting from the current L node:
- - Gehe zum L-Knoten am anderen Ende der L-Linie. Falls dieser L-Knoten noch nicht als benutzt markiert worden ist, führe die gleiche Prozedur mit diesem L-Knoten als aktuellem Knoten aus.- Go to the L node at the other end of the L line. If this L node has not yet been marked as used, do the same Procedure with this L node as the current node.
Nach Ausführung der bisherigen Verfahrensschritte wird die Bildvorlage durch eine Graphmenge durch Knoten, Linien und Stützstellenpunkten repräsentiert. In einem weiteren Schritt können die entstandenen Graphen noch einmal transformiert werden, insbesondere um den Erkennungsprozeß bei ganzen Worten im Gegensatz zu Einzelzeichen zu erleichtern. Hierzu wird die Repräsentation des Graphen derart geändert, daß die Stützstellen punkte der Polygonapproximation als Knoten zweiter Ordnung dargestellt werden. Daher wird in dieser transformierten Graphrepräsentation eine Linie mit Stützstellenpunkten ersetzt durch eine homogene Struktur mit abwechselnden Linien und Knoten. Dies kann rekursiv erfolgen analog zur Vorgehensweise, wie sie bei der ursprünglichen Graphrepräsentation aus den Ergebnissen der Linienrepräsentation angewandt wird. After the previous process steps have been carried out, the image will become available through a set of graphs through nodes, lines and support points represents. In a further step, the resulting graphs can be created be transformed again, especially around the recognition process to facilitate whole words as opposed to single characters. For this the representation of the graph is changed so that the support points points of the polygon approximation are represented as second-order nodes will. Therefore, in this transformed graph representation a Line with support points replaced by a homogeneous structure with alternating lines and nodes. This can be done recursively in analogy to How it works with the original graph representation the results of the line representation is applied.
Die Ausführung des erfindungsgemäßen Verfahrens erfolgt durch ein Computersystem, das zumindest eine Einrichtung zum Anlegen und zur Speicherung von Datenstrukturen aufweist, mit denen die oben beschrie bene Linienrepräsentation der Fig. 6, bestehend aus Linien- und Knotenge bieten sowie der Verbindungsstruktur dieser Gebiete, repräsentiert wird, sowie einer Einrichtung zum Speichern einer Datenstruktur, durch die die Graphrepräsentation der Fig. 7 repräsentiert wird, bestehend aus Graphen, die jeweils aus Knoten und Linien bestehen, wobei letztere aus Punkten aufgebaut sind. Vorzugsweise werden dabei die Elemente der Linien bzw. Graphrepräsentation als Objekte im Sinne der objektorientierten Technolo gie aufgefaßt. Darüber hinaus sind bei dem Computersystem eine Einrich tung zur Erzeugung von Binärbildern aus den Signalen einer optischen Abtastvorrichtung sowie weitere Vorrichtungen zur Weiterverarbeitung der Graphrepräsentation vorgesehen, wie in Fig. 1 dargestellt ist.The method according to the invention is carried out by a computer system which has at least one device for creating and storing data structures, with which the line representation of FIG. 6 described above, consisting of lines and nodes and the connection structure of these areas, is represented , and a device for storing a data structure, by which the graph representation of FIG. 7 is represented, consisting of graphs, each consisting of nodes and lines, the latter being constructed from points. The elements of the lines or graph representation are preferably understood as objects in the sense of object-oriented technology. In addition, a device for generating binary images from the signals of an optical scanning device and further devices for further processing of the graph representation are provided in the computer system, as shown in FIG. 1.
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19531392A DE19531392C1 (en) | 1995-08-26 | 1995-08-26 | Handwritten character graphical representation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19531392A DE19531392C1 (en) | 1995-08-26 | 1995-08-26 | Handwritten character graphical representation system |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19531392C1 true DE19531392C1 (en) | 1997-01-23 |
Family
ID=7770439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19531392A Expired - Fee Related DE19531392C1 (en) | 1995-08-26 | 1995-08-26 | Handwritten character graphical representation system |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19531392C1 (en) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19624977A1 (en) * | 1996-06-22 | 1998-01-02 | Siemens Ag | Process for processing mail |
EP0848350A1 (en) * | 1996-12-11 | 1998-06-17 | Hewlett-Packard Company | Method and apparatus for handwriting compression |
DE19718805A1 (en) * | 1997-05-03 | 1998-11-19 | Siemens Ag | Method and arrangement for recognizing distribution information |
DE19742771C1 (en) * | 1997-09-27 | 1998-12-10 | Siemens Ag | Distribution data recognition for video coding position on mail sorter |
US6018591A (en) * | 1994-07-04 | 2000-01-25 | Hewlett-Packard Company | Scribble matching |
DE19646522C2 (en) * | 1996-11-12 | 2000-08-10 | Siemens Ag | Method and device for recognizing distribution information on shipments |
DE19922788C1 (en) * | 1999-05-18 | 2000-10-05 | Siemens Ag | Procedure to sort in-house post |
DE10010241C1 (en) * | 2000-03-02 | 2001-03-01 | Siemens Ag | Shipment addresses reading method |
DE10064529C1 (en) * | 2000-12-22 | 2002-01-24 | Siemens Production & Logistics | Mail address post code reading method has address scanned in parts when full address cannot be clearly read |
DE10064226A1 (en) * | 2000-12-22 | 2002-07-18 | Siemens Production & Logistics | Method and device for reading postal codes from addresses on mail items |
DE10337831A1 (en) * | 2003-08-18 | 2005-03-24 | Sick Ag | Method for the optical recognition of alphanumeric characters |
WO2005049233A1 (en) | 2003-11-18 | 2005-06-02 | Siemens Ag | Method and apparatus for video coding by validation matrix |
US7181045B2 (en) | 2002-09-03 | 2007-02-20 | Siemens Ag | Method and device for reading the addresses of items of mail |
US7215794B2 (en) | 2002-03-19 | 2007-05-08 | Siemens Ag | Method and device for reading the addresses on items of mail |
WO2007094326A1 (en) | 2006-02-15 | 2007-08-23 | Konami Digital Entertainment Co., Ltd. | Trace information processing device, trace information processing method, information recording method, and program |
EP1450295B2 (en) † | 2003-02-19 | 2011-02-23 | Solystic | Optical mail recognition method using several binarisations |
-
1995
- 1995-08-26 DE DE19531392A patent/DE19531392C1/en not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
IEEE Trans. on PAMI, Vol. 16, Nr. 4, 1994, pp. 393-404 * |
JAKUB SEGEN: "Model Learning and Recognition of Nonrigid Objects", CH 2752-4/89 IEEE, pp. 597-602 * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6018591A (en) * | 1994-07-04 | 2000-01-25 | Hewlett-Packard Company | Scribble matching |
US6909789B1 (en) | 1996-06-22 | 2005-06-21 | Siemens Aktiengesellschaft | Method of processing postal matters |
DE19624977A1 (en) * | 1996-06-22 | 1998-01-02 | Siemens Ag | Process for processing mail |
US6665422B1 (en) | 1996-11-12 | 2003-12-16 | Siemens Aktiengesellchaft | Method and device for recognizing distribution data on postal packets |
DE19646522C2 (en) * | 1996-11-12 | 2000-08-10 | Siemens Ag | Method and device for recognizing distribution information on shipments |
EP0848350A1 (en) * | 1996-12-11 | 1998-06-17 | Hewlett-Packard Company | Method and apparatus for handwriting compression |
DE19718805A1 (en) * | 1997-05-03 | 1998-11-19 | Siemens Ag | Method and arrangement for recognizing distribution information |
DE19718805C2 (en) * | 1997-05-03 | 1999-11-04 | Siemens Ag | Method and arrangement for recognizing distribution information |
DE19742771C1 (en) * | 1997-09-27 | 1998-12-10 | Siemens Ag | Distribution data recognition for video coding position on mail sorter |
DE19922788C1 (en) * | 1999-05-18 | 2000-10-05 | Siemens Ag | Procedure to sort in-house post |
US6570115B1 (en) | 1999-05-18 | 2003-05-27 | Siemens Aktiengesellschaft | Method for sorting mail |
US6917009B2 (en) | 2000-03-02 | 2005-07-12 | Siemens Aktiengesellschaft | Method and apparatus for processing mail pieces |
DE10010241C1 (en) * | 2000-03-02 | 2001-03-01 | Siemens Ag | Shipment addresses reading method |
DE10064529C1 (en) * | 2000-12-22 | 2002-01-24 | Siemens Production & Logistics | Mail address post code reading method has address scanned in parts when full address cannot be clearly read |
DE10064226A1 (en) * | 2000-12-22 | 2002-07-18 | Siemens Production & Logistics | Method and device for reading postal codes from addresses on mail items |
DE10064226B4 (en) * | 2000-12-22 | 2006-04-20 | Siemens Ag | Method and apparatus for reading postal codes from addresses on broadcasts |
US7215794B2 (en) | 2002-03-19 | 2007-05-08 | Siemens Ag | Method and device for reading the addresses on items of mail |
US7181045B2 (en) | 2002-09-03 | 2007-02-20 | Siemens Ag | Method and device for reading the addresses of items of mail |
EP1450295B2 (en) † | 2003-02-19 | 2011-02-23 | Solystic | Optical mail recognition method using several binarisations |
DE10337831A1 (en) * | 2003-08-18 | 2005-03-24 | Sick Ag | Method for the optical recognition of alphanumeric characters |
US7346213B2 (en) | 2003-08-18 | 2008-03-18 | Sick Ag | Method for optically recognizing alpha-numerical characters |
WO2005049233A1 (en) | 2003-11-18 | 2005-06-02 | Siemens Ag | Method and apparatus for video coding by validation matrix |
WO2007094326A1 (en) | 2006-02-15 | 2007-08-23 | Konami Digital Entertainment Co., Ltd. | Trace information processing device, trace information processing method, information recording method, and program |
EP1985340A1 (en) * | 2006-02-15 | 2008-10-29 | Konami Digital Entertainment Co., Ltd. | Trace information processing device, trace information processing method, information recording method, and program |
EP1985340A4 (en) * | 2006-02-15 | 2009-03-25 | Konami Digital Entertainment | Trace information processing device, trace information processing method, information recording method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19531392C1 (en) | Handwritten character graphical representation system | |
DE4311172C2 (en) | Method and device for identifying a skew angle of a document image | |
DE60129872T2 (en) | Method for extracting titles from numerical images | |
DE3716787C2 (en) | ||
DE60222722T2 (en) | Method and device for correcting perspective distortions in document images and for summing image lines | |
EP2100258B1 (en) | Device, method and computer program for identifying a road sign in an image | |
DE60303202T2 (en) | SYSTEM AND METHOD FOR IDENTIFYING AND EXTRACTING CHARACTER CHARTS FROM RECORDED IMAGE DATA | |
DE69535098T2 (en) | Method and apparatus for searching images in a database | |
DE3419063C2 (en) | ||
DE69530566T2 (en) | Hough transform with fuzzy gradient and choice | |
EP1316057B1 (en) | Evaluation of edge direction information | |
DE69822608T2 (en) | Binarization method in a character recognition system | |
DE10036110A1 (en) | Inclination angle determination for bit pattern in two dimensional bar code, involves forming discrete histogram using computed inclinations of each edge line in edge field and designating highest inclination value as inclination angle | |
DE2752421A1 (en) | ARRANGEMENT FOR SCANNING AND DIGITALIZATION OF GRAPHIC REPRESENTATIONS OR DATA | |
DE3608438A1 (en) | METHOD FOR CALCULATING FREE CURVED SURFACES BY MEANS OF COMPUTER-AID DESIGN CAD AND COMPUTER-AID MANUFACTURING CAM AND NUMERICAL CONTROL NC | |
EP2082357B1 (en) | Device, method and computer program for identifying characters in an image | |
DE112021000371T5 (en) | DIGITAL IMAGE EDITING | |
DE2410306C3 (en) | Arrangement for setting a scanning grid or a recognition logic to the inclined position of characters to be scanned or recognized | |
DE102020202160A1 (en) | Method for determining a symmetry property in image data, method for controlling a function and device | |
EP0402868A2 (en) | Method for recognizing previously located character represented as digital grey-value images, in particular of character stamped into metal surfaces | |
WO2008034599A2 (en) | Method and device for image processing | |
EP0394959A2 (en) | Image analysis method | |
DE60317455T2 (en) | Segmentation of a composite image using basic rectangles | |
DE3238300A1 (en) | METHOD AND DEVICE FOR PATTERN OR CHARACTER RECOGNITION | |
EP0515714B1 (en) | Computer-aided binary image processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8100 | Publication of patent without earlier publication of application | ||
D1 | Grant (no unexamined application published) patent law 81 | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: SIEMENS AG, 80333 MUENCHEN, DE AB & M GMBH, 76131 |
|
8339 | Ceased/non-payment of the annual fee |