Estrategias de aprendizaje para la detección de contenido sensible
Autores: Povedano Álvarez, Daniel; Sandoval Orozco, Ana Lucila; García-Miguel, Javier Portela; García Villalba, Luis Javier
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estrategias de aprendizaje para la detección de contenido sensible
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Internet
Contenido sensible
Detección
Herramientas de TI
Algoritmos de aprendizaje profundo
Conjuntos de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 47
Citaciones: Sin citaciones
Actualmente, el volumen de contenido sensible en Internet, como la pornografía y la pornografía infantil, y la cantidad de tiempo que las personas pasan en línea (especialmente los niños) han llevado a un aumento en la distribución de dicho contenido (por ejemplo, imágenes de niños siendo abusados sexualmente, videos en tiempo real de dicho abuso, actividades de preparación, etc.). Por lo tanto, es esencial contar con herramientas de TI efectivas que automatizan la detección y bloqueo de este tipo de material, ya que el filtrado manual de grandes volúmenes de datos es prácticamente imposible. El objetivo de este estudio es llevar a cabo una revisión exhaustiva de diferentes estrategias de aprendizaje para la detección de contenido sensible disponibles en la literatura, desde las técnicas más convencionales hasta los algoritmos de aprendizaje profundo más avanzados, destacando las fortalezas y debilidades de cada uno, así como los conjuntos de datos utilizados. El rendimiento y la escalabilidad de las diferentes estrategias propuestas en este trabajo dependen de la heterogeneidad del conjunto de datos, las técnicas de extracción de características (hashes, visuales, auditivas, etc.) y los algoritmos de aprendizaje. Finalmente, se presentan nuevas líneas de investigación en la detección de contenido sensible.
Descripción
Actualmente, el volumen de contenido sensible en Internet, como la pornografía y la pornografía infantil, y la cantidad de tiempo que las personas pasan en línea (especialmente los niños) han llevado a un aumento en la distribución de dicho contenido (por ejemplo, imágenes de niños siendo abusados sexualmente, videos en tiempo real de dicho abuso, actividades de preparación, etc.). Por lo tanto, es esencial contar con herramientas de TI efectivas que automatizan la detección y bloqueo de este tipo de material, ya que el filtrado manual de grandes volúmenes de datos es prácticamente imposible. El objetivo de este estudio es llevar a cabo una revisión exhaustiva de diferentes estrategias de aprendizaje para la detección de contenido sensible disponibles en la literatura, desde las técnicas más convencionales hasta los algoritmos de aprendizaje profundo más avanzados, destacando las fortalezas y debilidades de cada uno, así como los conjuntos de datos utilizados. El rendimiento y la escalabilidad de las diferentes estrategias propuestas en este trabajo dependen de la heterogeneidad del conjunto de datos, las técnicas de extracción de características (hashes, visuales, auditivas, etc.) y los algoritmos de aprendizaje. Finalmente, se presentan nuevas líneas de investigación en la detección de contenido sensible.