Digitalisierung und digitale Transformation: Kleine Helfer erleichtern den Alltag

Scan-Apps gibt es wie Sand am Meer – und das aus gutem Grund: Sie machen aus einem beliebigen Smartphone einen mobilen Scanner und helfen so, viel schneller analoge Dokumente jeglicher Art zu digitalisieren, zu teilen und weiterzuverarbeiten. Bei der computergestützten Digitalisierung von Dokumenten sollten allerdings auch Themen wie Datenschutz und Rechtssicherheit mit einbezogen werden.

Hinter den Kulissen

Aufgrund der Omnipräsenz dieser Apps lohnt sich allemal ein Blick hinter die Kulissen. Nicht zuletzt, weil die hier vorgestellten Algorithmen auch in anderen Bereichen der Digitalisierung, beispielsweise beim autonomen Fahren in der Automobilindustrie, Anwendung finden. Ziel der Verarbeitung  ist es, das Dokument auf einem Foto so zu verarbeiten, dass das Endresultat aussieht, als wäre ein Flachbettscanner zum Einsatz gekommen. Dazu werden Algorithmen verwendet, die das Dokument aus dem Bild extrahieren, in ein Schwarzweiß-Bild wandeln und so transformieren, als hätte man das Dokument exakt frontal von oben fotografiert.

Algorithmen und Techniken des maschinellen Sehens

Abbildung 1 zeigt das Ausgangsmaterial, das mit einer Smartphone-Kamera aufgenommen wurde und Abbildung 10 das Endresultat nach der Verarbeitung. Dabei sind folgende Schritte notwendig:

1. Dokumentausschnitt bestimmen

Zur Bestimmung des Dokumentenausschnitts wird anfangs das Bild verkleinert; dies sorgt für eine schnellere Ausführung der weiteren Schritte. Auf dieses Bild wird dann der Gaußsche Weichzeichner angewendet, um Bildrauschen zu entfernen und mögliche „Lücken“ von Kanten zu schließen. Die Kanten können anschließend mit dem Canny-Algorithmus ermittelt werden. Vereinfacht kann man sagen, dass starke Helligkeitsunterschiede (also ein Hell-Dunkel-Übergang) auf eine Kante hindeuten. Der Algorithmus von Suzuki erkennt Konturen und sortiert diese in einer hierarchischen Struktur (äußere und innere Konturen). Die äußerste (und gleichzeitig größte) Kontur gibt hier die Außengrenzen des Dokumentes an und ist für die weitere Verarbeitung relevant. Die inneren Konturen sind hingegen nicht von Bedeutung. Die Kontur ist definiert aus einer endlichen Menge an Punkten. Allerdings werden für den letzten Schritt nur vier – nämlich die der Ecken des abfotografierten Blattes – benötigt. Dabei hilft uns der Douglas-Peucker-Algorithmus.

2. Binarisieren

Im nächsten Schritt wird wieder die Original-Aufnahme verwendet und in ein Schwarzweiß-Bild umgewandelt. Dazu wird ein adaptives Verfahren verwendet, um zu verhindern, dass das Foto potenziell viele schwarze oder weiße Flecken aufweist.

3. Dokumentenausschnitt transformieren

Nachdem jetzt das Originalmaterial aufgearbeitet und der Dokumentenbereich bestimmt worden ist, steht im letzten Schritt noch das „Geraderücken“ an. Dazu werden die vier Punkte der zuvor approximierten Kontur so gestreckt und gestaucht, dass sich ein Rechteck ergibt. Dadurch wirkt das Endergebnis (abhängig von der Qualität des Ausgangsmaterials) so, als hätte man einen Flachbettscanner verwendet.

Fazit

Die Qualität des Endergebnisses ist stark abhängig von der Qualität der Kamera, den Lichtverhältnissen und dem Winkel, mit dem das Dokument, das nicht geknickt sein sollte, fotografiert wird. Bei positiven Ausgangsparametern kann ein gutes Ergebnis erzielt werden. Eine Scan-App ist dabei eine gute Alternative, wenn es schnell gehen muss, wenngleich die besten Ergebnisse mit einem Scanner erreicht werden.

Autor Jakob Schulz ist IT-Consultant und Software Engineer bei der Interaction Room GmbH.