FerresDB é um banco de dados vetorial de alto desempenho desenvolvido em Rust, projetado para oferecer latências de busca abaixo de milissegundos e escalabilidade robusta para aplicações impulsionadas por IA. Ele integra perfeitamente a busca vetorial com a recuperação de texto BM25, suporta múltiplos protocolos incluindo REST, gRPC e WebSocket, e oferece recursos avançados como armazenamento em camadas e controle de acesso baseado em funções.
Principais Recursos e Funcionalidades:
- Latência Sub-Milissegundo: Alcança latências de busca P50 entre 100–500 microssegundos, garantindo respostas rápidas às consultas.
- Capacidades de Busca Híbrida: Combina busca vetorial densa com recuperação de texto BM25 usando fusão ponderada ou Fusão de Rank Recíproco (RRF) para maior precisão.
- Suporte a Múltiplos Protocolos: Oferece API REST para simplicidade, gRPC com streaming bidirecional para alta taxa de transferência, e WebSocket para aplicações em tempo real, todos rodando simultaneamente.
- Arquitetura de Armazenamento em Camadas: Gerencia automaticamente dados entre camadas de armazenamento Quente (RAM), Morno (mapeado em memória) e Frio (disco) com base na frequência de acesso, otimizando desempenho e custo.
- Técnicas Avançadas de Quantização: Utiliza quantização escalar SQ8, correção residual QJL e codificação PolarQuant para reduzir o uso de memória e melhorar as taxas de recall.
- Exploração de Grafos: Suporta grafos nativos em nível de ponto, permitindo a travessia de subgrafos via busca em largura (BFS) e combinando proximidade de grafo com similaridade vetorial para resultados enriquecidos.
- Observabilidade e Monitoramento: Fornece métricas Prometheus, perfilamento de consultas, rastreamento de consultas lentas e um painel web embutido para monitoramento abrangente do sistema.
Valor Principal e Soluções para Usuários:
FerresDB atende à necessidade crítica de soluções de busca vetorial eficientes e escaláveis em aplicações nativas de IA. Ao oferecer buscas de latência ultra-baixa, métodos de recuperação híbridos e opções de implantação flexíveis, ele capacita desenvolvedores a construir e escalar aplicações como motores de busca semântica, pipelines de geração aumentada por recuperação (RAG), sistemas de recomendação e grafos de conhecimento. Sua arquitetura robusta e recursos avançados garantem confiabilidade, segurança e desempenho, tornando-o uma escolha ideal para empresas que buscam aprimorar suas capacidades de IA.