Recomendações a outras pessoas considerando Apache Phoenix:
Todas as consultas SQL necessárias primeiro que seriam necessárias. Por exemplo, função de janela, classificações não estão lá. Análise coletada por e hospedada no G2.com.
Que problemas é Apache Phoenix E como isso está te beneficiando?
Usar ferramentas em massa é doloroso, usamos dump de CSV por enquanto.
O dump de CSV perde muitos recursos (comparado com o comando pg copy).
Temos apenas 1 tabela que tem uma combinação de linha de 2 colunas. A tabela contém ~1TB de dados.
Benefícios -
Muito econômico, usando recursos existentes como hbase, hadoop.
Bom para um caso de uso direto (mas se alguém quiser um banco de dados primário, é melhor tentar outros bancos de dados como cassandra, mongo etc., com base no caso de uso).
Ferramentas em massa são algo muito bom e eu as usei pela primeira vez com phoenix, no entanto, suporte para mais formatos como parquet, orc deveria ser usado embutido nas ferramentas em massa porque os dados não são armazenados em csv/json/tsv no datalake). Análise coletada por e hospedada no G2.com.