NLTK ist eine Plattform zum Erstellen von Python-Programmen zur Arbeit mit menschlichen Sprachdaten, die Schnittstellen zu Korpora und lexikalischen Ressourcen wie WordNet bietet, zusammen mit einer Suite von Textverarbeitungslibraries für Klassifikation, Tokenisierung, Stemming, Tagging, Parsing und semantisches Schließen, Wrapper für industrielle NLP-Bibliotheken und ein aktives Diskussionsforum.