Sobre el uso de la divergencia de Kullback-Leibler para la selección e interpretación de núcleos en autoencoders variacionales para la creación de características
Autores: Mendonça, Fábio; Mostafa, Sheikh Shanawaz; Morgado-Dias, Fernando; Ravelo-García, Antonio G.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Sobre el uso de la divergencia de Kullback-Leibler para la selección e interpretación de núcleos en autoencoders variacionales para la creación de características
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Enfoque
Selección de núcleo
Variables latentes
Selección de características
Divergencia de Kullback-Leibler
Autoencoder variacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio presenta un enfoque novedoso para la selección de núcleos basado en la divergencia de Kullback-Leibler en autoencoders variacionales utilizando características generadas por el codificador convolucional. La metodología propuesta se centra en identificar el subconjunto más relevante de variables latentes para reducir los parámetros del modelo. Cada variable latente se muestrea de la distribución asociada con un solo núcleo de la última capa convolucional del codificador, lo que resulta en una distribución individual para cada núcleo. Se seleccionan características relevantes de las variables latentes muestreadas para realizar la selección de núcleos, lo que filtra características no informativas y, en consecuencia, núcleos innecesarios. Tanto el método de filtro propuesto como la selección secuencial de características (método envolvente estándar) fueron examinados para la selección de características. En particular, el método de filtro evalúa la divergencia de Kullback-Leibler entre las distribuciones de todos los núcleos y plantea la hipótesis de que los núcleos similares pueden ser descartados ya que no transmiten información relevante. Esta hipótesis fue confirmada a través de los experimentos realizados en cuatro conjuntos de datos estándar, donde se observó que el número de núcleos puede reducirse sin afectar significativamente el rendimiento. Este análisis se basó en la precisión del modelo cuando los núcleos seleccionados alimentaron un clasificador probabilístico y el índice de similitud basado en características para evaluar la calidad de las imágenes reconstruidas cuando el autoencoder variacional solo utiliza los núcleos seleccionados. Por lo tanto, la metodología propuesta guía la reducción del número de parámetros del modelo, haciéndolo adecuado para desarrollar aplicaciones para dispositivos con recursos limitados.
Descripción
Este estudio presenta un enfoque novedoso para la selección de núcleos basado en la divergencia de Kullback-Leibler en autoencoders variacionales utilizando características generadas por el codificador convolucional. La metodología propuesta se centra en identificar el subconjunto más relevante de variables latentes para reducir los parámetros del modelo. Cada variable latente se muestrea de la distribución asociada con un solo núcleo de la última capa convolucional del codificador, lo que resulta en una distribución individual para cada núcleo. Se seleccionan características relevantes de las variables latentes muestreadas para realizar la selección de núcleos, lo que filtra características no informativas y, en consecuencia, núcleos innecesarios. Tanto el método de filtro propuesto como la selección secuencial de características (método envolvente estándar) fueron examinados para la selección de características. En particular, el método de filtro evalúa la divergencia de Kullback-Leibler entre las distribuciones de todos los núcleos y plantea la hipótesis de que los núcleos similares pueden ser descartados ya que no transmiten información relevante. Esta hipótesis fue confirmada a través de los experimentos realizados en cuatro conjuntos de datos estándar, donde se observó que el número de núcleos puede reducirse sin afectar significativamente el rendimiento. Este análisis se basó en la precisión del modelo cuando los núcleos seleccionados alimentaron un clasificador probabilístico y el índice de similitud basado en características para evaluar la calidad de las imágenes reconstruidas cuando el autoencoder variacional solo utiliza los núcleos seleccionados. Por lo tanto, la metodología propuesta guía la reducción del número de parámetros del modelo, haciéndolo adecuado para desarrollar aplicaciones para dispositivos con recursos limitados.