La biblioteca Apache OpenNLP es un conjunto de herramientas basado en aprendizaje automático para el procesamiento de texto en lenguaje natural que admite las tareas comunes de PLN, como la tokenización, la segmentación de oraciones, el etiquetado de partes del discurso, la extracción de entidades nombradas, el chunking, el análisis sintáctico y la resolución de correferencias. Estas tareas suelen ser necesarias para construir servicios de procesamiento de texto más avanzados e incluyen aprendizaje automático basado en máxima entropía y perceptrón.