Apache Pig est une plateforme pour l'analyse de grands ensembles de données qui se compose d'un langage de haut niveau pour exprimer des programmes d'analyse de données, associé à une infrastructure pour évaluer ces programmes. La propriété saillante des programmes Pig est que leur structure se prête à une parallélisation substantielle, ce qui leur permet de gérer des ensembles de données très volumineux.