Gorzen Engineering ofrece dos principales flujos de ingestión listos para producción: el Motor Avanzado y la Ingestión Gorzen.
Motor Avanzado: Este flujo está diseñado para manejar PDFs complejos, tablas, OCR, fórmulas, y requiere alta precisión empresarial. Soporta aceleración opcional por GPU y reranking de cross-encoder para una precisión mejorada. El Motor Avanzado se centra en la máxima fidelidad de extracción y precisión de recuperación, utilizando tecnologías como Docling 2.70+ y EasyOCR para tareas de análisis y OCR.
Ingestión Gorzen: Este flujo está adaptado para implementaciones rápidas y orientadas a la nube, utilizando APIs gestionadas como cargadores de LangChain y GPT-4o Vision. Enfatiza el despliegue rápido con bajo costo operativo.
Ambos flujos comparten una base vectorial unificada en Pinecone, lo que les permite escribir registros compatibles en la misma configuración de índice. Esta configuración asegura interoperabilidad y escalabilidad a través de diferentes casos de uso. El Motor Avanzado proporciona extracción determinista sin descripciones de imágenes generadas por IA, asegurando que el código y las fórmulas se extraigan literalmente.