A Gorzen Engineering oferece duas principais pipelines de ingestão prontas para produção: o Advanced Engine e o Gorzen Ingestion.
Advanced Engine: Esta pipeline é projetada para lidar com PDFs complexos, tabelas, OCR, fórmulas e requer alta precisão empresarial. Ela suporta aceleração opcional por GPU e reranking de cross-encoder para precisão aprimorada. O Advanced Engine foca na máxima fidelidade de extração e precisão de recuperação, utilizando tecnologias como Docling 2.70+ e EasyOCR para tarefas de análise e OCR.
Gorzen Ingestion: Esta pipeline é adaptada para implantações rápidas e orientadas para a nuvem, utilizando APIs gerenciadas como carregadores LangChain e GPT-4o Vision. Ela enfatiza a implantação rápida com baixo custo operacional.
Ambas as pipelines compartilham uma base vetorial unificada no Pinecone, permitindo que escrevam registros compatíveis na mesma configuração de índice. Esta configuração garante interoperabilidade e escalabilidade em diferentes casos de uso. O Advanced Engine fornece extração determinística sem descrições de imagens geradas por IA, garantindo que códigos e fórmulas sejam extraídos literalmente.