A biblioteca Apache OpenNLP é um conjunto de ferramentas baseado em aprendizado de máquina para o processamento de texto em linguagem natural que suporta as tarefas comuns de PLN, como tokenização, segmentação de sentenças, rotulagem de partes do discurso, extração de entidades nomeadas, chunking, parsing e resolução de correferência. Essas tarefas são geralmente necessárias para construir serviços de processamento de texto mais avançados e incluem aprendizado de máquina baseado em máxima entropia e perceptron.