Introducing G2.ai, the future of software buying.Try now

Desidentificación de Datos

por Brandon Summers-Miller
¿Qué es la desidentificación de datos y por qué es importante? Nuestra guía G2 puede ayudarte a entender la desidentificación de datos, cómo es utilizada por profesionales de la industria y los beneficios de la desidentificación de datos.

¿Qué es la desidentificación de datos?

La desidentificación de datos es un proceso que las empresas utilizan para interactuar y obtener valor de datos a los que se les ha eliminado la información sensible y personalmente identificable (PII). Las herramientas de desidentificación de datos identifican la PII y rompen su vínculo con los individuos mientras mantienen intacto el resto de los datos. Al hacerlo, se preserva la privacidad de los sujetos de los datos dentro del conjunto de datos. Las empresas que trabajan regularmente con datos susceptibles a menudo eligen desidentificarlos para cumplir con las regulaciones gubernamentales, incluidas GDPR, CCPA y HIPAA.

Los productos de desidentificación de datos operan de manera similar al software de enmascaramiento de datos, pero el primero tiene una menor probabilidad de que los datos sean reidentificados. Al anonimizar los datos y separar la información valiosa de la PII, como la edad de una persona, el código postal y el nombre, las organizaciones pueden compartir información regulada a través de su empresa y con terceros de una manera que reduce en gran medida el incumplimiento regulatorio.

Tipos de desidentificación de datos

Existen varios métodos diferentes para desidentificar datos, incluyendo:

  • Tokenización: Este método de desidentificación de datos reemplaza la PII especificada con otra frase, como una cadena aleatoria de información. Este método asegura que incluso si los datos son violados, los actores maliciosos solo descubrirán información sin sentido que no puede identificar a los individuos.
  • Reemplazo: Este método es similar a la tokenización en la eliminación de información sensible. Se diferencia en que en lugar de que los datos reales sean reemplazados por una cadena aleatoria de información, se reemplazan por datos fabricados que parecen reales.
  • Vault de privacidad: Una forma más reciente de desidentificación de datos, este método implica pasar los datos PII a través de un vault. El vault actúa como un filtro, identificando, separando y reemplazando datos sensibles y PII a través de varios métodos de desidentificación. La información separada se almacena en el vault y se protege mediante cifrado de datos.

Beneficios de usar la desidentificación de datos

Existen varios beneficios al desidentificar datos, que incluyen:

  • Cumplimiento: Las regulaciones gubernamentales, incluidas las normas GDPR y CCPA, tienen un lenguaje estricto con respecto a los datos que las organizaciones comparten con terceros. Para cumplir con estas normas, estipulan que los datos que contienen PII u otra información sensible no deben poder vincularse razonablemente con el individuo al que conciernen los datos.
  • Menor mantenimiento: Una vez que el vínculo entre los sujetos de los datos y los datos sensibles se ha roto a través de la desidentificación, el conjunto de datos se convierte en un activo de menor riesgo y menor mantenimiento. Por ejemplo, a menudo se requiere que las organizaciones informen sobre fugas y violaciones de datos que involucren datos sensibles y PII. Sin embargo, a menudo no hay requisitos legales para informar sobre fugas y violaciones que involucren datos que no pueden identificar a individuos.
  • Información valiosa: Los datos que han sido desidentificados a menudo se utilizan en conjuntos de datos agregados para detectar tendencias o características compartidas entre grupos de personas. En tales casos, ninguna información sensible eliminada agrega valor al conjunto de datos de todos modos, lo que significa que las empresas aún pueden utilizar los aspectos valiosos de los datos restantes sin comprometer la privacidad de ningún individuo.
  • Compartición de datos: Un beneficio principal de desidentificar datos es la capacidad que brinda a las organizaciones para compartir grandes conjuntos de datos con terceros. Dado que los datos no pueden vincularse a individuos pero contienen información valiosa, los terceros pueden ayudar a las organizaciones a derivar puntos de valor particulares de los datos sin conocer la identidad de nadie.

Elementos básicos de la desidentificación de datos

La desidentificación de datos incluye los siguientes elementos esenciales:

  • Eliminación de datos identificables: Para desidentificar adecuadamente los datos, se debe eliminar la información sensible. Esta información sensible incluye nombres, direcciones, números de teléfono, información de tarjetas de crédito, datos biométricos y más información que pueda identificar a individuos. La información abstracta como la edad, el peso, la altura u otros datos que no pueden identificar razonablemente a un individuo dentro del conjunto de datos puede permanecer para que las partes extraigan el valor necesario sin comprometer la privacidad de los sujetos de los datos.
  • Romper vínculos con los sujetos de los datos: Al eliminar la información que de otro modo identificaría a los individuos, se rompe el vínculo entre los datos de los que se puede derivar valor y la persona de la que se derivaron los datos restantes. En caso de una fuga de datos o violación de datos, esta separación dificulta que los actores maliciosos identifiquen a los sujetos de los datos a partir de conjuntos de datos anonimizados.

Desidentificación de datos vs. enmascaramiento de datos

La desidentificación de datos y el enmascaramiento de datos son conceptos estrechamente relacionados, pero difieren ligeramente.

  • Desidentificación de datos: Cuando los datos son desidentificados, la información sensible, incluida la PII, se separa o elimina del conjunto de datos. Esto hace que sea muy difícil identificar a los sujetos de los datos internamente o en caso de una violación o fuga de datos. Los métodos de desidentificación de datos a menudo implican reemplazar la PII con información fabricada o cadenas de texto sin sentido.
  • Enmascaramiento de datos: Enmascarar datos significa precisamente eso: ocultar puntos de información que aún están presentes dentro del conjunto de datos. Los métodos estándar de enmascaramiento de datos incluyen el cifrado y la redacción. Reidentificar a los individuos en datos enmascarados es posible si se elimina la máscara.
Brandon Summers-Miller
BS

Brandon Summers-Miller

Brandon is a Senior Research Analyst at G2 specializing in security and data privacy. Before joining G2, Brandon worked as a freelance journalist and copywriter focused on food and beverage, LGBTQIA+ culture, and the tech industry. As an analyst, Brandon is committed to helping buyers identify products that protect and secure their data in an increasingly complex digital world. When he isn’t researching, Brandon enjoys hiking, gardening, reading, and writing about food.

Software de Desidentificación de Datos

Esta lista muestra el software principal que menciona desidentificación de datos más en G2.

BizDataX hace que el enmascaramiento/anonimización de datos sea sencillo, clonando la producción o extrayendo solo un subconjunto de datos. Y lo enmascara en el camino, logrando el cumplimiento del GDPR más fácilmente.

IBM InfoSphere Optim Data Privacy protege la privacidad y apoya el cumplimiento utilizando capacidades extensas para desidentificar información sensible en aplicaciones, bases de datos y sistemas operativos.