La bibliothèque Apache OpenNLP est un ensemble d'outils basé sur l'apprentissage automatique pour le traitement du texte en langage naturel qui prend en charge les tâches NLP courantes, telles que la tokenisation, la segmentation de phrases, l'étiquetage des parties du discours, l'extraction d'entités nommées, le chunking, l'analyse syntaxique et la résolution de coréférence. Ces tâches sont généralement nécessaires pour construire des services de traitement de texte plus avancés et incluent l'apprentissage automatique basé sur l'entropie maximale et le perceptron.