
È più vicino ad Apache Lucene che a Elasticsearch o Apache Solr nel senso che non è un motore di ricerca server pronto all'uso, ma piuttosto un crate che può essere utilizzato per costruire un tale motore di ricerca. Aziende come Element, Humanfirst e Nuclia hanno utilizzato Tantivy per scatenare la potenza nei loro query di ricerca. Ci sono molti modi per utilizzare Tantivy. Tantivy può essere eseguito nel browser con un file WASM. Per gli amanti di Ruby, Tantiny offre binding Ruby stretti per Tantivy. Infine, puoi installare i binding Python nel repository Tantivy-Py. Le caratteristiche di Tantivy includono, ma non sono limitate a: - Ricerca full-text - Tokenizzatore configurabile (stemming disponibile per 17 lingue latine con supporto di terze parti per cinese (tantivy-jieba e cang-jie), giapponese (lindera, Vaporetto e tantivy-tokenizer-tiny-segmenter) e coreano (lindera + lindera-ko-dic-builder) - Veloce (controlla il 🐎 ? benchmark ? 🐎) - Tempo di avvio ridotto (<10ms), perfetto per strumenti da riga di comando - Scoring BM25 (lo stesso di Lucene) - Linguaggio di query naturale (es. (michael AND jackson) OR "king of pop") - Ricerca di query frasi (es. "michael jackson") - Indicizzazione incrementale - Indicizzazione multithread (l'indicizzazione di Wikipedia in inglese richiede < 3 minuti sul mio desktop) - Directory Mmap - Compressione intera SIMD quando la piattaforma/CPU include il set di istruzioni SSE2 - Campi veloci a valore singolo e multivalore u64, i64 e f64 (equivalente dei doc values in Lucene) - Campi veloci &[u8] - Campi di testo, i64, u64, f64, date e faccette gerarchiche - Archivio documenti compresso LZ4 - Query di intervallo - Ricerca con faccette - Indicizzazione configurabile (indicizzazione opzionale della frequenza dei termini e delle posizioni) - Campo JSON - Aggregation Collector: bucket di intervallo, media e metriche statistiche - LogMergePolicy con eliminazioni - API Searcher Warmer - Logo kitsch con un cavallo (ovviamente una caratteristica straordinaria) Le non-caratteristiche includono: La ricerca distribuita è fuori dal campo di applicazione di Tantivy, ma se stai cercando questa funzionalità, dai un'occhiata a Quickwit. È il nostro motore di ricerca, costruito sopra Tantivy.

Quickwit è la piattaforma di gestione e analisi dei log di nuova generazione per gestire petabyte di log. Abbiamo separato il calcolo e l'archiviazione per permettere alle aziende di scalare in modo indipendente e secondo le loro esigenze. È un'alternativa altamente affidabile ed economica a Elasticsearch. Costruito da e per i team per ingerire, indicizzare con un'interfaccia utente integrata e analizzare i log con Quickwit. I log ingeriti possono essere esaminati su uno storage a oggetti con query sotto il secondo. Le funzionalità includono, ma non sono limitate a: - Dati di indice persistenti su storage a oggetti - Ingestione di documenti JSON con o senza uno schema rigido - API di aggregazione compatibile con Elasticsearch - Funziona con una frazione delle risorse: scritto in Rust, alimentato dal potente tantivy - Funziona immediatamente con impostazioni predefinite sensate - Ottimizzato per la multi-tenancy. Aggiungi e scala i tenant senza costi aggiuntivi - Ricerca distribuita - Cloud-native: pronto per Kubernetes - Aggiungi e rimuovi nodi in pochi secondi - Calcolo e archiviazione separati - Dormi come un tronco: tutti i tuoi dati indicizzati sono archiviati in sicurezza su storage a oggetti (AWS S3...) - Ingerisci i tuoi documenti con semantica esattamente una volta - Ingestione nativa di Kafka - API di ricerca stream che sblocca notevolmente la ricerca full-text in ClickHouse AWS S3, PostgreSQL, Kubernetes, Kafka, Amazon Kinesis, Ceph e Minio sono alcuni degli strumenti che si integrano con Quickwit.


Quickwit Inc is a technology company that specializes in developing fast, cost-efficient, and scalable search solutions optimized for big data and observability. The company's primary product, Quickwit, is an open-source search engine designed to handle massive data volumes with rapid query performance and reduced infrastructure costs. It is particularly suited for log management and analytics, enabling real-time insights and efficient data retrieval. Quickwit emphasizes user-friendliness, with a focus on easy deployment and integration into existing data pipelines.