Apache Gobblin est un cadre d'intégration de données distribué conçu pour simplifier les aspects courants de l'intégration de grandes données tels que l'ingestion de données, la réplication, l'organisation et la gestion du cycle de vie pour les écosystèmes de données en streaming et par lots.