Que problemas é Apache Ranger E como isso está te beneficiando?
gestão centralizada de políticas para o ecossistema Hadoop em produção
O Ranger fornece mascaramento dinâmico de dados (em movimento) para vários frameworks do stack Hadoop (por exemplo, HBase, Storm, Knox, Solr, Kafka e YARN). Nosso artigo recentemente publicado no FGCS (revista Q1) usou o console de administração do Ranger para definir/modificar políticas (aplicação de políticas). Nessa pesquisa, definimos uma arquitetura de referência para sistemas de big data que utilizam o Apache Ranger e o ACL para gerenciar políticas de repositório. O Ranger verificará o controle de acesso de clientes em nível granular, ou seja, a quais colunas de tabelas e bancos de dados HBase/Hive eles têm acesso, filas do Kafka e nível de acesso ao HDFS. Enquanto isso, o ACL verificará o controle de acesso das demais entidades. No entanto, as políticas do Ranger terão prioridade sobre as do ACL. Se uma política do Ranger não existir, então o ACL local entrará em vigor. As autenticações dos daemons do Hadoop e a comunicação interna (como o status das tarefas) dependerão principalmente do uso do principal do Kerberos e das localizações dos arquivos keytab e são aplicadas usando o controle de acesso central do Hadoop, ou seja, ACL.
Outro caso foi o uso do Servidor de Auditoria do Ranger na configuração de federação do Hadoop. Nosso corretor de acesso proposto para federação de big data agregará todos os logs de acesso em um repositório centralizado (RDBMS, HDFS ou Log4j). Demonstramos como usar o Ranger e outros frameworks para Gestão e Análise de Auditoria. Em suma, o Apache Ranger fornece administração e gestão de segurança centralizada para o Hadoop, enquanto o Knox simplifica a segurança para serviços e usuários externos que acessam os dados do cluster e executam trabalhos. Análise coletada por e hospedada no G2.com.