Resumen del artículo Un enfoque híbrido con GAN y DP para la preservación de la privacidad de los datos de IIoT.

Enfoque híbrido GAN-DP para preservar privacidad datos IIoT.

Anonimización es un problema significativo al manejar datos del Internet Industrial de las Cosas (IIoT, por sus siglas en inglés). Las aplicaciones de Aprendizaje Automático (ML, por sus siglas en inglés) requieren datos desencriptados para realizar tareas eficientemente, lo cual significa que terceros involucrados en el procesamiento de datos pueden tener acceso a información sensible. Esto plantea un riesgo de filtración de privacidad y divulgación de información para las empresas que generan los datos. En consecuencia, debido a estas preocupaciones, las empresas dudan en compartir sus datos de IIoT con terceros.

El estado del arte en la resolución del problema de anonimización involucra varios enfoques como la encriptación, encriptación homomórfica, técnicas criptográficas y aprendizaje distribuido/federado. Sin embargo, estos métodos tienen limitaciones en términos de costos computacionales, explicabilidad de los modelos de ML y vulnerabilidades a ciberataques. Además, las técnicas existentes de preservación de privacidad a menudo resultan en un compromiso entre privacidad y precisión, donde lograr una alta protección de privacidad conduce a una pérdida significativa en la precisión del modelo de ML. Estos desafíos dificultan la preservación efectiva y eficiente de la privacidad de los datos de IIoT.

En este contexto, un equipo de investigación de la Universidad Kadir Has en Turquía propuso un método novedoso que combina Redes Generativas Adversarias (GAN) y Privacidad Diferencial (DP) para preservar datos sensibles en operaciones de IIoT. El enfoque híbrido tiene como objetivo lograr la preservación de privacidad con una pérdida mínima de precisión y bajos costos computacionales adicionales. Se utiliza GAN para generar copias sintéticas de datos sensibles, mientras que DP introduce ruido y parámetros aleatorios para mantener la privacidad. El método propuesto se prueba utilizando conjuntos de datos disponibles públicamente y un conjunto de datos de IIoT realista recopilado de un proceso de producción de confitería.

Los autores proponen un enfoque híbrido de preservación de privacidad para entornos de IIoT. Su método involucra dos componentes principales: GAN y DP.

  1. GAN: Utilizan GAN, específicamente el enfoque GAN Tabular Condicional (CTGAN), para crear una copia sintética (XG) del conjunto de datos original (XO). GAN aprende la distribución de los datos y genera datos sintéticos con estadísticas similares a las del original.
  2. DP: Para mejorar la privacidad, agregan ruido aleatorio de una distribución Laplaciana a características sensibles en los datos. Esta técnica preserva la privacidad al tiempo que mantiene la distribución de probabilidad general de los datos.

El enfoque propuesto implica lo siguiente:

  • Crear un conjunto de datos sintético con GAN.
  • Reemplazar características sensibles.
  • Aplicar privacidad diferencial mediante la adición de ruido aleatorio.

El conjunto de datos resultante preserva la privacidad y se puede utilizar para análisis de aprendizaje automático sin comprometer información sensible. La complejidad del algoritmo depende del número de características sensibles y el tamaño del conjunto de datos. Los autores enfatizan que su método garantiza la protección de privacidad general de los datos de IIoT.

La evaluación realizada en este artículo involucró la realización de experimentos para probar el enfoque híbrido propuesto para la síntesis y predicción de datos preservando la privacidad. Los experimentos se realizaron en cuatro conjuntos de datos SCADA: turbina eólica, producción de vapor, eficiencia energética y motores síncronos. Los experimentos utilizaron la generación de datos sintéticos CTGAN y técnicas de privacidad diferencial (DP). Los criterios de evaluación incluyeron la medición de la precisión utilizando la métrica R-cuadrado y la preservación de privacidad utilizando seis métricas de privacidad. Los resultados mostraron que el enfoque híbrido propuesto logró una mayor precisión y preservación de privacidad que otros métodos, como CTGAN y DP. Los experimentos también probaron el rendimiento del método propuesto en conjuntos de datos con características sensibles ocultas y demostraron su capacidad para proteger dichos datos sensibles.

En conclusión, el artículo propuso un enfoque híbrido novedoso que combina GAN y DP para abordar el problema de anonimización en los datos del Internet Industrial de las Cosas (IIoT). El método propuesto implica la creación de un conjunto de datos sintético utilizando GAN y la aplicación de DP mediante la adición de ruido aleatorio a características sensibles. Los resultados de la evaluación demostraron que el enfoque híbrido propuesto logró una mayor precisión y preservación de privacidad que otros métodos. Este enfoque ofrece una solución prometedora para preservar datos sensibles en entornos de IIoT mientras se minimiza la pérdida de precisión y los costos computacionales.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Intenciones de Código de IA

Cualquier IDE moderno incluye Intenciones de Código que te permiten realizar algunas acciones predefinidas en tu códi...

Inteligencia Artificial

Aprendizaje profundo para objetos profundos ZoeDepth es un modelo de IA para la estimación de profundidad en múltiples dominios

¿Alguna vez te has encontrado con ilusiones en las que un niño en la imagen parece más alto y más grande que un adult...

Inteligencia Artificial

Robot Blando Camina al Inflarse Repetidamente

Investigadores de la Universidad de Cornell y del Instituto Tecnológico de Israel, Technion, han diseñado un robot cu...

Ciencias de la Computación

Tres postdoctorados en física del MIT en español reciben becas de la Fundación Botton.

Los destinatarios Luis Antonio Benítez, Carolina Cuesta-Lázaro y Fernando Romero López reciben apoyo para su investig...

Aprendizaje Automático

Construir un Sistema de Recomendación Utilizando Google Cloud.

Implementar un sistema de recomendación altamente avanzado utilizando la IA de recomendación de Google Cloud.