Blog

Analysen und Neuigkeiten zu Dokumenten-Verarbeitung, KI und Finanztechnologie

Dokumentenbetrug erkennen: Was ein PDF nicht verbergen kann

Dokumentenbetrug erkennen: Was ein PDF nicht verbergen kann

Früher dachten wir, Dokumentenbetrug sei ein visuelles Problem. Falsche Schriftarten. Verschobene Spalten. Ein Logo, das nicht ganz stimmig wirkte. Wir bauten Prüfungen basierend auf dem, was Menschen sehen, denn das war alles, was wir hatten.

G

Greg T

Mär 23, 2026
Wenn Dokumente zurückschlagen

Wenn Dokumente zurückschlagen

Seite 1: Kontoübersicht, zwei Spalten. Seite 15: Dasselbe Konto, drei Spalten, andere Überschriften. Seite 47: Ein Scan mit einem Kaffeefleck. Seite 89: Die Seite mit den Summen, die sich auf Transaktionen beziehen, die Sie vor 70 Seiten extrahiert haben.

G

Greg T

Feb 24, 2026
Der unsichtbare Audit-Trail

Der unsichtbare Audit-Trail

Ein Wirtschaftsprüfer öffnet Ihre Exportdatei, findet einen Endsaldo von 47.500 € und ruft das Quell-PDF auf. Seite 3, unten rechts: 47.000 €. Eine andere Zahl. "Woher kommt die Differenz? Wer hat das geändert?"

G

Greg T

Feb 07, 2026
HoloRecall: Zeigen statt erklären

HoloRecall: Zeigen statt erklären

Es gibt in jedem Klassifizierungsprojekt diesen Moment, in dem man beobachtet, wie das Modell selbstbewusst etwas falsch macht. Kein schwieriger Fall. Kein mehrdeutiger Grenzfall. Etwas, das ein Mensch in einer halben Sekunde lösen würde, ohne nachzudenken.

G

Greg T

Jan 21, 2026
Dein LLM ist keine Dokumenten-Pipeline

Dein LLM ist keine Dokumenten-Pipeline

Es gibt in jedem KI-Projekt diesen Moment, in dem die Demo so gut aussieht, dass dein Gehirn leise anfängt, Code zu löschen. Du siehst zu, wie ein Modell einen Kontoauszug "liest", und denkst: das ist es. Wir können OCR überspringen. Wir können das Layout-Parsing überspringen. Vielleicht können wir die halbe Pipeline überspringen. In der Filmversion drückt jemand Enter und JSON fällt wie ein Wasserfall aus der Cloud.

G

Greg T

Sep 21, 2025
PDFs sind für Menschen, nicht für Daten

PDFs sind für Menschen, nicht für Daten

Wir lieben PDFs. Sie sehen auf jedem Gerät gleich aus, drucken wunderschön in jeder Größe und sind das Nächste, was wir an digitalem Papier haben. Aber jedes Mal, wenn jemand in unserem Team sagt: „Lass uns einfach die Daten aus dem PDF extrahieren“, spüren wir, wie ein uralter PostScript-Dämon erwacht und flüstert: **„Ich wurde geboren, um Pixel zu malen, nicht um deine Zeilen zu strukturieren.“**

G

Greg T

Sep 20, 2025
Holofin