Sparrow è una libreria open-source Python e un sistema API per estrarre dati strutturati da documenti utilizzando Modelli di Linguaggio Visivo (VLMs). Elabora fatture, ricevute, moduli, estratti conto bancari, tabelle e altri tipi di documenti per restituire dati strutturati in formato JSON. Oltre all'estrazione di documenti, Sparrow supporta l'elaborazione di istruzioni testuali personalizzate per qualsiasi compito AI, inclusi analisi dei dati, sintesi, decision making e flussi di lavoro di elaborazione del testo generali.
Sparrow estrae testo e dati da immagini (PNG, JPG) e PDF multi-pagina utilizzando la convalida dello schema JSON per garantire un'estrazione dati accurata. Il sistema può elaborare documenti complessi, inclusi tabelle, moduli e rapporti finanziari multi-pagina. Inoltre, gestisce richieste basate su istruzioni personalizzate come operazioni aritmetiche, analisi del testo, sintesi dei contenuti e altri compiti potenziati dall'AI senza richiedere l'input di documenti.
La piattaforma offre supporto per più backend, inclusi MLX per Apple Silicon, Ollama, vLLM, PyTorch e Hugging Face Cloud GPU. Fornisce endpoint API RESTful per l'integrazione, un'interfaccia web interattiva per il caricamento e l'elaborazione dei documenti, un'interfaccia a riga di comando per l'elaborazione in batch e include un cruscotto di analisi integrato con monitoraggio del flusso di lavoro.
Sparrow presenta un sistema di pipeline plug-in con Sparrow Parse per l'elaborazione visiva, Sparrow Instructor per l'elaborazione delle istruzioni testuali e Sparrow Agents per flussi di lavoro complessi. Il sistema utilizza l'estrazione basata su schema con convalida automatica e offre capacità di elaborazione sul dispositivo per la privacy dei dati. L'orchestrazione del flusso di lavoro basata su agenti include il monitoraggio visivo potenziato da Prefect.
I casi d'uso comuni includono l'elaborazione automatizzata di fatture e ricevute, l'analisi di documenti finanziari, l'estrazione di dati da moduli, il riconoscimento della struttura delle tabelle, l'elaborazione di istruzioni AI personalizzate, l'analisi del testo e la sintesi, e flussi di lavoro di elaborazione documentale multi-step. Sparrow funziona su Python 3.10+ e offre opzioni di licenza sia open-source (GPL 3.0) che commerciale.