Introducing G2.ai, the future of software buying.Try now
Produkt-Avatar-Bild
Apache Nutch

Von The Apache Software Foundation

Unbeanspruchtes Profil

Beanspruchen Sie das G2-Profil Ihres Unternehmens

Die Beanspruchung dieses Profils bestätigt, dass Sie bei Apache Nutch arbeiten und ermöglicht es Ihnen, zu verwalten, wie es auf G2 erscheint.

    Nach der Genehmigung können Sie:

  • Aktualisieren Sie die Details Ihres Unternehmens und Ihrer Produkte

  • Steigern Sie die Sichtbarkeit Ihrer Marke auf G2, in der Suche und in LLMs

  • Zugriff auf Einblicke zu Besuchern und Wettbewerbern

  • Auf Kundenbewertungen antworten

  • Wir werden Ihre Arbeits-E-Mail überprüfen, bevor wir Zugriff gewähren.

4.0 von 5 Sternen

Wie würden Sie Ihre Erfahrung mit Apache Nutch bewerten?

Es sind zwei Monate vergangen, seit dieses Profil eine neue Bewertung erhalten hat
Eine Bewertung hinterlassen

Apache Nutch Bewertungen & Produktdetails

Produkt-Avatar-Bild

Haben sie Apache Nutch schon einmal verwendet?

Beantworten Sie einige Fragen, um der Apache Nutch-Community zu helfen

Apache Nutch-Bewertungen (20)

Bewertungen

Apache Nutch-Bewertungen (20)

4.0
20-Bewertungen

Review Summary

Generated using AI from real user reviews
Benutzer loben durchweg die Skalierbarkeit und Benutzerfreundlichkeit von Apache Nutch und heben seine Fähigkeit hervor, große Datenmengen effizient zu durchsuchen. Viele schätzen die Open-Source-Natur und die Flexibilität zur Anpassung durch Plugins, was es für verschiedene Projekte geeignet macht. Einige Benutzer bemerken jedoch, dass die Dokumentation unzureichend sein kann, was neue Benutzer behindern könnte.
Bewertungen durchsuchen
Bewertungen filtern
Ergebnisse löschen
G2-Bewertungen sind authentisch und verifiziert.
Narendra A.
NA
Senior Software Engineer
Unternehmen (> 1000 Mitarbeiter)
"Apache Nutch ist ein Rockstar in Bezug auf das Crawlen großer Datenmengen."
Was gefällt dir am besten Apache Nutch?

Als ich Apache Nutch benutzte, war ich von der Geschwindigkeit beeindruckt, mit der es Daten durchsucht, sowie von den Bibliotheken und Datenstrukturen, die zur Anpassung des Crawlings und zum Lesen der Daten im gewünschten Format bereitgestellt werden. Ich durchsuchte die gesamten IBM-Daten, um Erkenntnisse zu gewinnen und Textanalysen durchzuführen. Die Unterstützung, die ich von den Foren erhielt, war ebenfalls großartig. Insgesamt war es also eine schöne Erfahrung, den Apache Nutch Crawler zu verwenden. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Was mir nicht gefiel, war die Video-Unterstützung, die es im Internet bietet. Bewertung gesammelt von und auf G2.com gehostet.

Jaydip L.
JL
Senior Software Engineer
Kleinunternehmen (50 oder weniger Mitarbeiter)
"Sehr effizientes, schnelleres und quelloffenes Werkzeug für Crawler"
Was gefällt dir am besten Apache Nutch?

Open Source

Skalierbar

Parsing- und Indexierungstechniken.

Einfache Integration mit Elasticsearch und Solr.

Verschiedene Plugins zum Parsen verschiedener Inhaltstypen. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Nicht viel auf meiner Liste der Abneigungen, weil wir es wirklich sehr genossen haben und es unsere organisatorischen Bedürfnisse erfüllt hat. Aber basierend auf Erfahrung kann ich einige Nachteile nennen, wie dass es eine gute Infrastruktur erfordert und eine beträchtliche Menge an Speicher und CPU-Auslastung verbraucht. Wir haben auch das Gefühl, dass es sehr hilfreich für uns wäre, wenn Nutch ein gutes Dashboard und eine Art Admin-Panel bereitstellen würde. Bewertung gesammelt von und auf G2.com gehostet.

SA
Quality Assurance Test Engineer
Unternehmen mittlerer Größe (51-1000 Mitarbeiter)
"Web-Crawling-Tool"
Was gefällt dir am besten Apache Nutch?

Es war ein Open-Source-Tool, dem Sie Ihre eigenen Plugins hinzufügen können. Sie können den eigenen Code nach Belieben ändern. Es war sehr einfach zu bedienen. Es kann auch mit verschiedenen Tools ausgeführt werden. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Sie sollten wissen, welche Version von Nutch für andere Werkzeuge geeignet ist, mit denen Sie arbeiten. Bewertung gesammelt von und auf G2.com gehostet.

Naser A.
NA
Research Officer
Unternehmen mittlerer Größe (51-1000 Mitarbeiter)
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
"Ich bin Big-Data-Entwickler bei KICS, UET Lahore, Pakistan."
Was gefällt dir am besten Apache Nutch?

Ich benutze Apache Nutch seit 3 oder 4 Jahren, ich mag es als Open-Source-Tool, das auf einem System mit normalen Spezifikationen laufen kann und Millionen von Seiten crawlen kann. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

* Ich mag seinen Algorithmus zur Erstellung von Seeds nicht, er bildet Cluster und geht dann in eine Schleife, um dieselben Websites zu durchsuchen, wenn er Millionen von Seiten durchsucht hat.

* Seine Konfiguration ist nicht einfach.

* Dokumentation ist nicht gut.

* Support ist nicht gut. Bewertung gesammelt von und auf G2.com gehostet.

Prafulla R.
PR
Technical Architect
Kleinunternehmen (50 oder weniger Mitarbeiter)
"Nutch ist ein leichtgewichtiges Scraping-Tool, das eine triviale Lernkurve bei seiner Einführung hat."
Was gefällt dir am besten Apache Nutch?

-Einfach zu konfigurieren

-Stabiler Backend-Speicher Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Die Verwendung von Java macht es etwas sperrig. Man muss auf die Heap-Größe achten, sonst sind OOM-Fehler unvermeidlich. Bewertung gesammelt von und auf G2.com gehostet.

Krishnan S.
KS
Software Engineer
Unternehmen mittlerer Größe (51-1000 Mitarbeiter)
"Extrahieren zur Tiefe"
Was gefällt dir am besten Apache Nutch?

Crawl von URL ist eine ausgezeichnete Funktion, um den Inhalt zu lesen. Nutch ist ein sehr nützliches Werkzeug, um den Inhalt im Dokument in verschiedenen Tiefen zu lesen. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Etwas schwierig, die Crawl-Funktion anzupassen. Bewertung gesammelt von und auf G2.com gehostet.

Ruchika J.
RJ
Hadoop Developer
Kleinunternehmen (50 oder weniger Mitarbeiter)
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
"Butch ist ein hoch skalierbarer Open-Source-Webcrawler. Es kann an die Anforderungen angepasst werden."
Was gefällt dir am besten Apache Nutch?

Plugins für Indizierung und Suche.

Integration mit Solar und anderen Tools.

Es funktioniert auch gut in Hadoop-Clustern. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Mangel an Gemeinschaft, um über ein beliebiges Problem oder Anliegen zu diskutieren.

Mangel an Dokumenten für die Implementierung und Integration von Nutch. Bewertung gesammelt von und auf G2.com gehostet.

Usama T.
UT
Python Developer
Unternehmen mittlerer Größe (51-1000 Mitarbeiter)
"Ein großartiger Web-Crawler für alle Crawling-Bedürfnisse"
Was gefällt dir am besten Apache Nutch?

Seine Funktion, das gesamte Web mit internen und externen Links zu durchsuchen, was es zu einem unendlichen Crawling macht. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Wir müssen ein sehr starkes Wissen über Apache Hadoop, Hbase, Zookeeper und die vollständige Einrichtung der Umgebung haben. Wir müssen darin sehr effizient sein, um dies zu nutzen. Außerdem können wir Hbase-Daten nicht leicht einsehen, was ebenfalls sehr schwierig ist. Bewertung gesammelt von und auf G2.com gehostet.

Fred Z.
FZ
Founder
Unternehmen (> 1000 Mitarbeiter)
"Nutch ist ein zuverlässiger, ausgereifter Open-Source-Crawler."
Was gefällt dir am besten Apache Nutch?

Ich habe Nutch mehrmals eingesetzt, wenn ich schnell einen Crawler aufstellen musste. Es ist kostenlos, unkompliziert, zuverlässig, gut dokumentiert und kommt mit einer OTS-Integration mit Apache Solr für die Suche. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Das Verzeichnis- und Dateipartitionierungsschema für den Crawler kann etwas verwirrend sein. Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Pharmazeutika
IP
Kleinunternehmen (50 oder weniger Mitarbeiter)
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
"Am besten für das Web-Crawling"
Was gefällt dir am besten Apache Nutch?

Ich mag die standardmäßige Indexerstellung für Crawler. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Wenn ich mit dem Ubuntu-Betriebssystem arbeite, finde ich es schwierig, die Verzeichnispfade einzurichten. Bewertung gesammelt von und auf G2.com gehostet.

Preise

Preisinformationen für dieses Produkt sind derzeit nicht verfügbar. Besuchen Sie die Website des Anbieters, um mehr zu erfahren.

Apache Nutch Vergleiche
Produkt-Avatar-Bild
Apache Tika
Jetzt vergleichen
Produkt-Avatar-Bild
Produkt-Avatar-Bild
Apache Nutch