Hypatos – a new entity within the group

Hypatos – a new company within the group

We welcome a new member of the group. Hypatos uses deeplearning technology to automate document processing tasks in backoffices to improve work and make organisations more efficient.

About Hypatos (text in German):

„Hypatos ist ein Technologieunternehmen spezialisiert auf die Optimierung von Verfahren des Deep Learning von semistrukturierten Daten. Mittels speziellen mehrschichtigen künstlichen Neuronalen Netzen (KNN) werden Muster in Texten und Formularen erkannt, die keiner allgemeinen Struktur unterliegen, sondern nur einen Teil der Strukturinformationen (z.B. eine Tabelle oder eine Auflistung) in sich tragen.

Dies bedeutet, dass das künstlich Neuronale Netz selbständig Inhalte in Texten extrahiert und interpretiert. Weisen solche Künstlich Neuronalen Netz (KNN) mehrere Schichten auf, so wird das Netz immer lernfähiger und leistungsfähiger, benötigt aber auch viel mehr an Daten, um angelernt zu werden. Solche mehrschichtigen Netze machen erst ein Deep Learning möglich.

Das Erkennen von Mustern und extrahieren von Informationen aus semistrukturierten Texten und Formularen nennt man Data Capture bzw. Daten Extraktion. Der Unterschied zum einfachen OCR ist, dass das neuronale Netz die Bedeutung, d.h. die Semantik dessen was extrahiert wurde, „versteht“, d.h. im Kontext interpretieren kann.

Folglich kann mit den extrahierten Daten in Applikationen sinnvoll weitergearbeitet werden. Mit logischen semantischen Verfahren ist eine Datenextraktion auch möglich, wenn die Suche nach einer Musterfolge immer gleich ist, z.B. das Suchen nach einer Zeichenfolge, welche beispielsweise eine Steurer ID repräsentiert. Hier ist die Zeichenfolge immer gleich aufgebaut. Dieses Verfahren mit logischen Algorithmen ist bei semantisch leicht interpretierbaren Daten immer günstiger und präziser als KNN, allerdings scheitern diese Verfahren, sobald keine klaren identifizierenden semantischen Daten oder Zeichenfolgen enthalten sind.

Ein Beispiel sind Eingangsrechnungen mit vielen Einzelpositionen. Auf dieser Rechnung lernt man beispielsweise ein KNN an, alle einzelnen Positionen mit den Artikeln (Nummer, Bezeichnung), die Menge, den Einzelpreis, die Umsatzsteuer und den Bruttopreis zu erkennen. Genauso erkennt es die Zahlungsart, den Kreditoren, die Skontofrist, die IBAN, usw., obwohl diese Rechnung noch niemals vorher exakt so dem KNN angelernt wurde.

Das KNN lernt das Muster wie Eingangsrechnungen prinzipiell aussehen und aufgebaut sind und schafft dann bei der Extraktion in Analogie zu dem gelernten die Interpretation der unbekannten Rechnungsdaten. Dies geschieht über Ähnlichkeitsvergleiche, in dem Muster im Text und auf dem Beleg erkannt und richtig interpretiert werden.

Wie beim Menschen sind solche gelernten Inhalte nicht immer 100% exakt. Daher bewertet das KNN die Ergebnisse mit einem Konfidenzniveau. Dabei wird aufgrund des Gelernten und Erkannten die Wahrscheinlichkeit bewertet, wie sicher die Interpretation des Erkannten durch das Neuronalen Netzes ist. Umso höher das durchschnittliche Konfidenzniveau, umso besser ist das KNN.

Das KNN lernt dabei immer mehr hinzu. Dieses Anlernen des KNN nennt man bei semistrukturellen Daten zumeist Labeling, da entweder ein Mensch oder ein Automatismus dem Netz auf einem Formular zeigt, welche Zeichenfolgen wie zu interpretieren sind.

HYPATOS ist ein reines Technologieunternehmen, welches mehrschichtige künstliche Neuronale Netze aufbaut, trainiert und optimiert. Die trainierten und selbstlernenden Netze werden dann anderen Softwarehäusern so zur Verfügung gestellt, dass diese bei einer Themenstellung des Data Capture für semistrukturierte Daten in die Anwendung eingebaut werden kann. Ein angelerntes Netz sollte so aufgebaut werden, dass es im Alltag durch permanente Kontrolle und Korrektur immer besser wird, d.h. lernend bleibt.“

Go to Hypatos Website