¿Qué es lo que no te gusta de Apify?
Nuestra experiencia con el scraper de Twitter de Apify comenzó positivamente, pero con el tiempo se volvió extremadamente decepcionante y costosa debido a múltiples problemas que afectaron directamente la fiabilidad y el control del presupuesto.
1. Parámetros que no funcionan como se esperaba
Muchos de los parámetros proporcionados por el actor no se comportaron de manera consistente. Incluso cuando configuramos límites como el número máximo de elementos a obtener, el scraper no siempre los respetó. Esto hizo muy difícil confiar en el actor en un flujo de trabajo de producción donde el comportamiento predecible es crítico.
2. Obtención innecesaria que desperdició nuestro presupuesto
En varias ocasiones, el scraper obtuvo miles de tweets a pesar de que se configuraron límites estrictos. Estas ejecuciones consumieron una gran cantidad de recursos e incrementaron inesperadamente nuestros costos. Lo que empeoró esto fue que estas obtenciones no fueron intencionalmente activadas por nosotros, sin embargo, la plataforma aún cobró por ellas. Cuando planteamos el problema, no hubo una resolución significativa ni reembolso, a pesar de que el comportamiento claramente excedía los límites configurados.
3. Obtención de tweets desactualizados en lugar de recientes
Otro problema recurrente fue que el scraper frecuentemente devolvía tweets antiguos en lugar de los más recientes, incluso al usar opciones destinadas a obtener los resultados más recientes. Para flujos de trabajo sensibles al tiempo, esto hace que los datos sean poco fiables. A menudo vimos situaciones donde aparecían tweets del día anterior mientras que los tweets publicados en la última hora faltaban por completo.
4. Comportamiento incierto e inconsistente del scraper
El comportamiento general del scraper de Twitter se sentía impredecible. Configuraciones idénticas a veces producían resultados completamente diferentes entre ejecuciones. Algunas ejecuciones omitían tweets relevantes, mientras que otras devolvían datos irrelevantes o desactualizados. Este nivel de inconsistencia dificulta confiar en la herramienta para sistemas automatizados.
Aunque Apify proporciona una plataforma capaz y una interfaz amigable para desarrolladores, la falta de control estricto sobre los límites, los resultados de scraping poco fiables y las pobres salvaguardas de costos crearon serios problemas operativos para nosotros. Para cualquier sistema que dependa de la recolección de datos predecible y el gasto controlado, estos problemas pueden volverse muy costosos muy rápidamente.
Hasta que se implementen salvaguardas más fuertes, un comportamiento de parámetros más claro y mejores mecanismos de protección de costos, es difícil recomendar confiar en el scraper de Twitter para flujos de trabajo críticos de producción. Reseña recopilada por y alojada en G2.com.