La replica dei dati è il processo di memorizzazione dei dati in più di una posizione per migliorare sia la disponibilità che l'accessibilità. Comporta la copia frequente dei dati da un database (o altro archivio dati) a uno che consente a tutti gli utenti di condividere lo stesso livello di informazioni. La replica dei dati può anche ridurre il carico di lavoro sui database (ad esempio, transazionali) dove le prestazioni sono fondamentali. Il software di replica dei dati facilita questo processo, offrendo strumenti per integrare, distribuire, centralizzare e sincronizzare i dati tra questi vari archivi e sistemi. Ciò consente agli utenti di gestire volumi di dati in crescita ottenendo accesso a informazioni in tempo reale.
In termini di scala di replica, può esserci una replica completa, in cui l'intero database è memorizzato in ogni sito. Può anche esserci una replica parziale, in cui alcuni frammenti del database frequentemente utilizzati sono replicati e altri non lo sono. Gli strumenti di replica dei dati includono anche la capacità di catturare e identificare le modifiche apportate a un database, noto anche come cattura delle modifiche ai dati (CDC).
Il software di replica dei dati fornisce all'utente finale un'interfaccia grafica in cui può gestire e monitorare centralmente i propri dati replicati. In tal modo, i team di infrastruttura—che gestiscano server, macchine virtuali, database o altre infrastrutture—possono utilizzare il software di replica dei dati per migliorare la disponibilità dei dati e garantire che siano coerenti.
Il software di replica dei dati è simile al software di backup del server nella misura in cui entrambi possono essere utilizzati per l'archiviazione di una copia dei dati aziendali. Tuttavia, il backup del server è più limitato; il suo principale caso d'uso è prevenire la perdita di dati in scenari di disastro, mentre la replica dei dati è più ampia ed è utilizzata in qualsiasi caso in cui un'azienda possa voler avere copie dei dati in diversi database, server, ecc. Il software di replica dei dati è tipicamente utilizzato insieme al software di integrazione dei dati, che consente alle aziende di estrarre dati da diverse fonti e formati in un unico luogo, e al software di elaborazione e distribuzione di big data, che offre un modo per raccogliere, distribuire, memorizzare e gestire enormi set di dati non strutturati in tempo reale.
Per qualificarsi per l'inclusione nella categoria Replica dei Dati, un prodotto deve:
Consentire l'integrazione dei dati in tempo reale con cattura delle modifiche ai dati basata su log
Replicare dati/infrastruttura su un'ampia gamma di database, data warehouse e altre piattaforme
Catturare e identificare le modifiche apportate a un database (CDC)
Fornire un'interfaccia per gli utenti per monitorare la replica dei dati