Privacidad-preservando descripción de imágenes con cifrado parcial y aprendizaje profundo
Autores: Martin, Antoinette Deborah; Moon, Inkyu
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Privacidad-preservando descripción de imágenes con cifrado parcial y aprendizaje profundo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Subtitulado de imágenes
Preocupaciones de privacidad
Cifrado parcial
Codificación de Doble Fase Aleatoria (DRPE)
Aprendizaje profundo
Regiones sensibles
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Aunque la descripción de imágenes ha ganado un interés notable, se plantean preocupaciones de privacidad porque depende en gran medida de las imágenes, y existe un riesgo de exponer información sensible en los datos de la imagen. En este estudio, se propone un marco de descripción de imágenes que preserva la privacidad y que aprovecha el cifrado parcial utilizando la Codificación de Fase Doble Aleatoria (DRPE) y el aprendizaje profundo para abordar las preocupaciones de privacidad. A diferencia de los métodos anteriores que dependen de un cifrado completo o enmascaramiento, nuestro enfoque implica cifrar regiones sensibles de la imagen mientras se preserva la estructura general y el contexto de la imagen. El cifrado parcial garantiza que la información de las regiones sensibles se conserve en lugar de perderse al enmascararla con un recuadro negro o gris. También permite que el modelo procese regiones cifradas y no cifradas, lo cual podría ser problemático para modelos con imágenes completamente cifradas. Nuestro marco sigue una arquitectura codificador-decodificador donde un codificador de doble flujo basado en ResNet50 extrae características de las imágenes parcialmente cifradas, y se emplea una arquitectura de transformador en el decodificador para generar descripciones a partir de estas características. Utilizamos el conjunto de datos de Flickr8k y ciframos las regiones sensibles utilizando DRPE. Las imágenes parcialmente cifradas se alimentan al codificador de doble flujo, que procesa las partes real e imaginaria de las regiones cifradas por separado para una extracción efectiva de características. Nuestro modelo se evalúa utilizando métricas estándar y se compara con modelos entrenados en las imágenes originales. Nuestros resultados demuestran que nuestro método logra un rendimiento comparable a los modelos entrenados en imágenes originales y enmascaradas, y supera a los modelos entrenados en datos completamente cifrados, verificando así la viabilidad del cifrado parcial en la descripción de imágenes que preserva la privacidad.
Descripción
Aunque la descripción de imágenes ha ganado un interés notable, se plantean preocupaciones de privacidad porque depende en gran medida de las imágenes, y existe un riesgo de exponer información sensible en los datos de la imagen. En este estudio, se propone un marco de descripción de imágenes que preserva la privacidad y que aprovecha el cifrado parcial utilizando la Codificación de Fase Doble Aleatoria (DRPE) y el aprendizaje profundo para abordar las preocupaciones de privacidad. A diferencia de los métodos anteriores que dependen de un cifrado completo o enmascaramiento, nuestro enfoque implica cifrar regiones sensibles de la imagen mientras se preserva la estructura general y el contexto de la imagen. El cifrado parcial garantiza que la información de las regiones sensibles se conserve en lugar de perderse al enmascararla con un recuadro negro o gris. También permite que el modelo procese regiones cifradas y no cifradas, lo cual podría ser problemático para modelos con imágenes completamente cifradas. Nuestro marco sigue una arquitectura codificador-decodificador donde un codificador de doble flujo basado en ResNet50 extrae características de las imágenes parcialmente cifradas, y se emplea una arquitectura de transformador en el decodificador para generar descripciones a partir de estas características. Utilizamos el conjunto de datos de Flickr8k y ciframos las regiones sensibles utilizando DRPE. Las imágenes parcialmente cifradas se alimentan al codificador de doble flujo, que procesa las partes real e imaginaria de las regiones cifradas por separado para una extracción efectiva de características. Nuestro modelo se evalúa utilizando métricas estándar y se compara con modelos entrenados en las imágenes originales. Nuestros resultados demuestran que nuestro método logra un rendimiento comparable a los modelos entrenados en imágenes originales y enmascaradas, y supera a los modelos entrenados en datos completamente cifrados, verificando así la viabilidad del cifrado parcial en la descripción de imágenes que preserva la privacidad.