Teoría de la Información Semántica G y Inferencia Bayesiana Lógica para el Aprendizaje Automático
Autores: Lu, Chenguang
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Teoría de la Información Semántica G y Inferencia Bayesiana Lógica para el Aprendizaje Automático
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje automático
Etiquetas
Inferencia bayesiana
Funciones de pertenencia
Algoritmos de coincidencia de canales
Aprendizaje multilabel
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Un problema importante en el aprendizaje automático es que, al usar más de dos etiquetas, es muy difícil construir y optimizar un grupo de funciones de aprendizaje que sigan siendo útiles cuando se cambia la distribución previa de las instancias. Para resolver este problema, se combinan la teoría de la información semántica G, la Inferencia Bayesiana Lógica (LBI) y un grupo de algoritmos de Coincidencia de Canal (CM) para formar una solución sistemática. Un canal semántico en la teoría G consiste en un grupo de funciones de verdad o funciones de pertenencia. En comparación con las funciones de verosimilitud, los posteriores bayesianos y las funciones logísticas que se utilizan típicamente en métodos populares, las funciones de pertenencia son más convenientes de usar, proporcionando funciones de aprendizaje que no sufren el problema mencionado. En la Inferencia Bayesiana Lógica (LBI), cada etiqueta se aprende de manera independiente. Para el aprendizaje multilabel, podemos obtener directamente un grupo de funciones de pertenencia optimizadas a partir de una muestra lo suficientemente grande con etiquetas, sin necesidad de preparar diferentes muestras para diferentes etiquetas. Además, se desarrolla un grupo de algoritmos de Coincidencia de Canal (CM) para el aprendizaje automático. Para la clasificación de Máxima Información Mutua (MMI) de tres clases con distribuciones gaussianas en un espacio de características bidimensional, solo se requieren de 2 a 3 iteraciones para que la información mutua entre tres clases y tres etiquetas supere el 99% de la MMI para la mayoría de las particiones iniciales. Para los modelos de mezcla, se mejora el algoritmo de Expectativa-Maximización (EM) para formar el algoritmo CM-EM, que puede superar al algoritmo EM cuando las proporciones de mezcla son desiguales o cuando existe convergencia local. El algoritmo de iteración CM necesita combinarse con redes neuronales para la clasificación MMI en espacios de características de alta dimensión. La LBI necesita una investigación adicional para la unificación de estadísticas y lógica.
Descripción
Un problema importante en el aprendizaje automático es que, al usar más de dos etiquetas, es muy difícil construir y optimizar un grupo de funciones de aprendizaje que sigan siendo útiles cuando se cambia la distribución previa de las instancias. Para resolver este problema, se combinan la teoría de la información semántica G, la Inferencia Bayesiana Lógica (LBI) y un grupo de algoritmos de Coincidencia de Canal (CM) para formar una solución sistemática. Un canal semántico en la teoría G consiste en un grupo de funciones de verdad o funciones de pertenencia. En comparación con las funciones de verosimilitud, los posteriores bayesianos y las funciones logísticas que se utilizan típicamente en métodos populares, las funciones de pertenencia son más convenientes de usar, proporcionando funciones de aprendizaje que no sufren el problema mencionado. En la Inferencia Bayesiana Lógica (LBI), cada etiqueta se aprende de manera independiente. Para el aprendizaje multilabel, podemos obtener directamente un grupo de funciones de pertenencia optimizadas a partir de una muestra lo suficientemente grande con etiquetas, sin necesidad de preparar diferentes muestras para diferentes etiquetas. Además, se desarrolla un grupo de algoritmos de Coincidencia de Canal (CM) para el aprendizaje automático. Para la clasificación de Máxima Información Mutua (MMI) de tres clases con distribuciones gaussianas en un espacio de características bidimensional, solo se requieren de 2 a 3 iteraciones para que la información mutua entre tres clases y tres etiquetas supere el 99% de la MMI para la mayoría de las particiones iniciales. Para los modelos de mezcla, se mejora el algoritmo de Expectativa-Maximización (EM) para formar el algoritmo CM-EM, que puede superar al algoritmo EM cuando las proporciones de mezcla son desiguales o cuando existe convergencia local. El algoritmo de iteración CM necesita combinarse con redes neuronales para la clasificación MMI en espacios de características de alta dimensión. La LBI necesita una investigación adicional para la unificación de estadísticas y lógica.