¿Qué problemas resuelve Apache Ranger ¿Y cómo te beneficia eso?
gestión centralizada de políticas para el ecosistema Hadoop en producción
Ranger proporciona enmascaramiento dinámico de datos (en movimiento) para varios marcos de la pila de Hadoop (por ejemplo, HBase, Storm, Knox, Solr, Kafka y YARN). Nuestro artículo recientemente publicado en el FGCS (revista Q1) https://www.sciencedirect.com/science/article/pii/S0167739X19315948 utilizó la consola de administración de Ranger para establecer/modificar políticas (aplicación de políticas). En esa investigación, definimos una arquitectura de referencia para sistemas de big data que utilizan Apache Ranger y el ACL para gestionar políticas de repositorio. Ranger verificará el control de acceso de cliente de grano fino, es decir, a qué columnas de tablas y bases de datos de HBase/Hive tienen acceso, colas de Kafka y nivel de acceso a HDFS. Mientras tanto, el ACL verificará el control de acceso de las entidades restantes. Sin embargo, las políticas de Ranger tendrán prioridad sobre las de ACL. Si no existe una política de Ranger, entonces el ACL local entrará en efecto. Las autenticaciones de demonios de Hadoop y la comunicación interna (como el estado de las tareas) dependerán principalmente del uso del principal de Kerberos y las ubicaciones de archivos keytab y se aplicarán utilizando el control de acceso central de Hadoop, es decir, ACL.
Otro caso fue emplear el Servidor de Auditoría de Ranger en la configuración de federación de Hadoop. Nuestro corredor de acceso a la federación de big data propuesto agregará todos los registros de acceso en un repositorio centralizado (RDBMS, HDFS o Log4j). Demostramos cómo usar Ranger y otros marcos para la Gestión y Análisis de Auditorías. En resumen, Apache Ranger proporciona administración y gestión de seguridad centralizada de Hadoop, mientras que Knox agiliza la seguridad para los servicios y usuarios externos que acceden a los datos del clúster y ejecutan trabajos. Reseña recopilada por y alojada en G2.com.