Nichts! Es ist für mich nutzlos geworden. Ich habe einen offenen Fall bei Paypal. Bewertung gesammelt von und auf G2.com gehostet.
Ok, mein Ziel hat Captchas im Quellcode, also muss ich sie manuell umgehen, aber dann wird die HTML-Datei (das ist, was ich will) gesperrt. Ich bin auf einem MAC und habe versucht herauszufinden, warum, ohne Erfolg. Wenn ich den Namen in .txt ändere, wird sie sichtbar. Die Software ist kompliziert (es ist wahrscheinlich darauf ausgelegt, Börsendaten von Yahoo etc. zu scrapen), aber auch teuer, wenn alles, was ich brauche, ein Crawler ist, um Text zu extrahieren. Bewertung gesammelt von und auf G2.com gehostet.




