Apache Nutch è un progetto software open source per crawler web estensibile e scalabile. Nutch fornisce interfacce estensibili come Parse, Index e ScoringFilter per implementazioni personalizzate, ad esempio Apache Tika per l'analisi.
Currently we are using apache nutch as standalone Crawler that need manual configuration and scheduling of crawls. If we need programatically create new crawl jobs (using rest api). Is there any easy to use library available?
Con oltre 3 milioni di recensioni, possiamo fornire i dettagli specifici che ti aiutano a prendere una decisione informata sull'acquisto di software per la tua azienda. Trovare il prodotto giusto è importante, lasciaci aiutarti.