Recomendaciones a otros que estén considerando Apache Phoenix:
Todas las consultas SQL primero que serían necesarias. Por ejemplo, la función de ventana, los rangos no están allí. Reseña recopilada por y alojada en G2.com.
¿Qué problemas resuelve Apache Phoenix ¿Y cómo te beneficia eso?
Usar herramientas masivas es un dolor, usamos volcado CSV por ahora.
El volcado CSV carece de muchas características (comparado con el comando pg copy).
Tenemos solo 1 tabla que tiene una combinación de filas de 2 columnas. La tabla contiene ~1TB de datos.
Beneficios -
Muy rentable, usando recursos existentes hbase, hadoop.
Bueno para un caso de uso directo (pero si alguien quiere una base de datos primaria, es mejor probar otras bases de datos como cassandra, mongo, etc., según el caso de uso).
Las herramientas masivas son algo muy bueno y las usé por primera vez con phoenix, sin embargo, el soporte para más formatos como parquet, orc debería estar incorporado en las herramientas masivas porque los datos no se almacenan en csv/json/tsv en el lago de datos). Reseña recopilada por y alojada en G2.com.