Gorzen Engineering offre due principali pipeline di ingestione pronte per la produzione: il Motore Avanzato e Gorzen Ingestion.
Motore Avanzato: Questa pipeline è progettata per gestire PDF complessi, tabelle, OCR, formule e richiede un'elevata precisione aziendale. Supporta l'accelerazione GPU opzionale e il reranking cross-encoder per una precisione migliorata. Il Motore Avanzato si concentra sulla massima fedeltà di estrazione e precisione di recupero, utilizzando tecnologie come Docling 2.70+ ed EasyOCR per compiti di parsing e OCR.
Gorzen Ingestion: Questa pipeline è pensata per implementazioni rapide e orientate al cloud, utilizzando API gestite come i caricamenti di LangChain e GPT-4o Vision. Sottolinea una rapida implementazione con un basso carico operativo.
Entrambe le pipeline condividono una dorsale vettoriale unificata in Pinecone, permettendo loro di scrivere record compatibili nella stessa configurazione di indice. Questo setup assicura interoperabilità e scalabilità attraverso diversi casi d'uso. Il Motore Avanzato fornisce un'estrazione deterministica senza descrizioni di immagini generate dall'IA, garantendo che codice e formule siano estratti alla lettera.