
v4.0 API (GA) – Eine einheitliche, stabile REST-API mit aktualisierten SDKs für Python, .NET, Java usw., die Konsistenz und Leistung verbessert.
Verbesserte Lese- und Layout-Modelle – Bessere OCR-Genauigkeit, hierarchische Dokumentenstruktur und Unterstützung für die Erstellung durchsuchbarer PDFs.
Erweiterte Vorgefertigte Modelle – Stärkere Extraktion für Rechnungen, Quittungen, Kontoauszüge, Steuerformulare, Gehaltsabrechnungen und andere Geschäftsdokumente.
Erweiterte Klassifizierung & Modellzusammensetzung – Automatische Klassifizierung von Dokumenten, Aufteilung von Multi-Dokument-PDFs und Weiterleitung an das richtige Extraktionsmodell.
Batch-Verarbeitung & Container – Batch-APIs unterstützen jetzt alle Modelle, plus containerisierte Lese-/Layout-Modelle für lokale oder hybride Bereitstellungen. Bewertung gesammelt von und auf G2.com gehostet.
Höhere Genauigkeit bei komplexen Layouts
Es treten immer noch Schwierigkeiten bei stark verschachtelten Tabellen, mehrspaltigen PDFs, handschriftlichen Notizen gemischt mit Druckschrift und minderwertigen Scans auf.
Bessere mehrsprachige und regionale Unterstützung
Die Genauigkeit für indische Regionalsprachen, gemischte Sprachdokumente und nicht-lateinische Schriften kann insbesondere in Tabellen verbessert werden.
Einfacheres Training von benutzerdefinierten Modellen
Das Training von benutzerdefinierten Modellen erfordert immer noch eine sorgfältige Kennzeichnung und Datenvorbereitung; mehr Low-Code- / Auto-Labeling-Funktionen wären hilfreich. Bewertung gesammelt von und auf G2.com gehostet.




