Il software di analisi dei big data fornisce approfondimenti su grandi set di dati raccolti da cluster di big data. Questi strumenti aiutano gli utenti aziendali a comprendere le tendenze, i modelli e le anomalie dei dati e a sintetizzare le informazioni in visualizzazioni di dati, report e dashboard comprensibili. A causa della natura non strutturata dei cluster di big data, queste soluzioni di analisi richiedono spesso un linguaggio di query per estrarre i dati dal file system. Alcune soluzioni possono offrire funzionalità self-service in modo che i dipendenti non tecnici possano assemblare i propri grafici e diagrammi dai set di big data.
Alcune soluzioni di analisi dei big data offrono funzionalità alimentate da machine learning, come l'elaborazione del linguaggio naturale, permettendo all'utente di interrogare i dati aziendali in modo naturale. Il software di analisi dei big data è comunemente utilizzato nelle aziende che eseguono Hadoop in combinazione con software di elaborazione e distribuzione dei big data per raccogliere e memorizzare i dati. Inoltre, questi prodotti si integrano tipicamente con il software di data warehouse, il centro di archiviazione centrale per i dati integrati di un'azienda.
Il software di analisi dei big data si differenzia dalle piattaforme di analisi in quanto i primi sono esclusivamente focalizzati sulla manipolazione di cluster di big data complessi e su larga scala in visualizzazioni comprensibili, mentre le seconde sono orientate verso una vasta gamma di fonti di dati e connettori. Le due categorie sono mutuamente esclusive, e quei prodotti che sono esclusivamente focalizzati su casi d'uso di big data sono classificati solo nella categoria di analisi dei big data.
Per qualificarsi per l'inclusione nella categoria di Analisi dei Big Data, un prodotto deve:
Consumare dati, interrogare file system e connettersi direttamente ai cluster di big data
Permettere agli utenti di preparare set di big data complessi in visualizzazioni di dati utili e comprensibili
Creare report, visualizzazioni e dashboard applicabili al business basati sulle scoperte all'interno dei set di dati