Stanford Word Segmenter

(2)2.8/5

El Segmentador de Palabras de Stanford actualmente admite árabe y chino, y se ha encontrado que los esquemas de segmentación proporcionados funcionan bien para una variedad de aplicaciones. El sistema requiere que Java 1.8+ esté instalado, y recomienda al menos 1G de memoria para documentos que contienen oraciones largas. Para archivos con oraciones más cortas (por ejemplo, 20 tokens), disminuya el requisito de memoria cambiando la opción java -mx1g en los scripts de ejecución.