
A dire il vero, la cosa migliore di Apache Arrow è quanto velocemente permette di lavorare con grandi set di dati. Il formato di memoria colonnare accelera enormemente l'elaborazione dei dati, specialmente per l'analisi e il machine learning. La facilità d'uso non è delle migliori all'inizio perché c'è un po' di curva di apprendimento, ma una volta che ci si prende la mano, il miglioramento delle prestazioni vale assolutamente la pena.
Inoltre, la facilità di integrazione è solida: funziona molto bene con Pandas, Spark e Parquet, quindi spostare i dati tra i sistemi è molto più fluido rispetto ad altri formati. E poiché è compatibile tra linguaggi, puoi usarlo in Python, Java, C++ e altro senza preoccuparti di fastidiose conversioni di formato.
In termini di numero di funzionalità, è ricco di un sacco di ottimizzazioni per gestire i dati in memoria in modo super efficiente. Lo uso tutto il tempo e, onestamente, è un po' un must-have per l'elaborazione dati ad alte prestazioni. L'unico svantaggio? Il supporto clienti è principalmente basato sulla comunità, quindi a volte devi cercare un po' per trovare risposte. Ma nel complesso, la facilità di implementazione non è troppo male, e una volta impostato, è un punto di svolta per la gestione dei big data. Recensione raccolta e ospitata su G2.com.
Onestamente, non è la cosa più facile con cui iniziare. La curva di apprendimento è piuttosto ripida, specialmente se non hai mai avuto a che fare con l'archiviazione colonnare prima. Configurarlo può essere frustrante, e la facilità di implementazione non è esattamente fluida—richiede molti tentativi ed errori, specialmente quando si cerca di integrarlo in una pipeline esistente.
Inoltre, la documentazione è un po' sparsa. Alcune parti sono ottime, ma altre? Non tanto. A volte ti ritrovi a dover indovinare, il che fa sembrare il supporto clienti quasi inesistente dato che la maggior parte dell'aiuto proviene dalla comunità open-source. Il debug può essere un problema anche—è così ottimizzato che anche una piccola configurazione errata può compromettere le prestazioni in modi difficili da capire.
Detto ciò, una volta superata la lotta iniziale, il numero di funzionalità e la facilità di integrazione con strumenti come Pandas, Spark e Parquet lo rendono assolutamente valido. Ma sì, non aspettarti che sia super amichevole per i principianti—ci vuole sicuramente un po' di tempo per abituarsi. Recensione raccolta e ospitata su G2.com.
Per G2, preferiamo recensioni fresche e ci piace seguire i revisori. Potrebbero non aver aggiornato il testo della loro recensione, ma hanno aggiornato la loro valutazione.
Validato tramite LinkedIn
Recensione organica. Questa recensione è stata scritta interamente senza invito o incentivo da parte di G2, un venditore o un affiliato.
Questa recensione è stata tradotta da English usando l'IA.

