O Segmentador de Palavras de Stanford atualmente suporta árabe e chinês, e os esquemas de segmentação fornecidos têm se mostrado eficazes para uma variedade de aplicações. O sistema requer que o Java 1.8+ esteja instalado, e recomenda-se pelo menos 1G de memória para documentos que contêm frases longas. Para arquivos com frases mais curtas (por exemplo, 20 tokens), diminua o requisito de memória alterando a opção java -mx1g nos scripts de execução.