Olive - Data Ingestion Framework
O Olive Data Ingestion Framework é uma ferramenta versátil e agnóstica em relação à nuvem, projetada para simplificar os processos de ingestão e transferência de dados. Ele se conecta perfeitamente a várias fontes e destinos de dados, facilitando um manuseio de dados mais rápido e eficiente. O ODIF opera sem a necessidade de clusters pré-instalados e pode ser implantado com uso mínimo de recursos. Sua interface web amigável permite fácil registro de fontes de dados, configuração de trabalhos, execução e monitoramento.
Principais Características e Funcionalidades:
- Conectores Reutilizáveis: Uma vez criados, os conectores podem funcionar tanto como fonte quanto como destino, aumentando a flexibilidade.
- Suporte a Fontes RDBMS: Permite a seleção de múltiplos bancos de dados e tabelas, com opções para recuperação de conjuntos de dados completos ou subconjuntos específicos usando cláusulas where.
- Mecanismo de Divisão de Trabalhos: Divide automaticamente grandes conjuntos de dados em trabalhos menores para acelerar a ingestão.
- Suporte a Múltiplos Formatos de Arquivo: Compatível com formatos de arquivo CSV, TXT, Parquet e JSON no destino.
- Tipos de Carga: Suporta tanto cargas incrementais para ingestão regular quanto cargas completas para transferências de dados históricas ou únicas.
- Interface de Usuário e Acesso a API: Oferece tanto uma interface web quanto APIs REST para controle abrangente.
- Agendamento de Trabalhos: Permite o agendamento de trabalhos para execução em intervalos especificados.
- Integração com Livy: Suporta Livy em clusters estáticos para capacidades de processamento aprimoradas.
- Flexibilidade de Cluster: Opera em clusters estáticos e sob demanda nas plataformas AWS, Azure e GCP.
Valor Principal e Soluções para Usuários:
O ODIF aborda as complexidades da ingestão de dados oferecendo uma solução nativa da nuvem e agnóstica em relação à plataforma que simplifica a conexão entre diversas fontes e destinos de dados. Suas capacidades de computação dinâmicas e design orientado por API garantem uma transferência de dados eficiente sem a sobrecarga de uma configuração extensa de infraestrutura. Ao automatizar tarefas como divisão e agendamento de trabalhos, o ODIF reduz a intervenção manual, acelera o processamento de dados e melhora a eficiência operacional geral para organizações que lidam com operações de dados em larga escala.