Apache Pig es una plataforma para analizar grandes conjuntos de datos que consiste en un lenguaje de alto nivel para expresar programas de análisis de datos, junto con una infraestructura para evaluar estos programas. La propiedad destacada de los programas Pig es que su estructura es adecuada para una paralelización sustancial, lo que a su vez les permite manejar conjuntos de datos muy grandes.