Un tubería de aprendizaje automático topológico para clasificación
Autores: Conti, Francesco; Moroni, Davide; Pascali, Maria Antonietta
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un tubería de aprendizaje automático topológico para clasificación
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tubería
Diagramas de persistencia
Filtración
Métodos de representación
Aprendizaje automático
Resumen topológico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
En este trabajo, desarrollamos un pipeline que asocia Diagramas de Persistencia a datos digitales a través de la filtración más apropiada para el tipo de datos considerado. Utilizando un enfoque de búsqueda en cuadrícula, este pipeline determina los métodos de representación y parámetros óptimos. El desarrollo de un pipeline topológico para Aprendizaje Automático implica dos pasos cruciales que afectan fuertemente su rendimiento: en primer lugar, los datos digitales deben ser representados como un objeto algebraico con una filtración asociada adecuada para calcular su resumen topológico; en segundo lugar, el diagrama de persistencia debe ser transformado con métodos de representación adecuados para ser introducido en un algoritmo de Aprendizaje Automático. Evaluamos el rendimiento de nuestro pipeline y, al mismo tiempo, comparamos los diferentes métodos de representación en conjuntos de datos de referencia populares. Este trabajo es un primer paso hacia un pipeline fácil y listo para usar para la clasificación de datos utilizando homología persistente y Aprendizaje Automático, y para comprender las razones teóricas por las cuales, dada un conjunto de datos y una tarea a realizar, un par (filtración, representación topológica) es mejor que otro.
Descripción
En este trabajo, desarrollamos un pipeline que asocia Diagramas de Persistencia a datos digitales a través de la filtración más apropiada para el tipo de datos considerado. Utilizando un enfoque de búsqueda en cuadrícula, este pipeline determina los métodos de representación y parámetros óptimos. El desarrollo de un pipeline topológico para Aprendizaje Automático implica dos pasos cruciales que afectan fuertemente su rendimiento: en primer lugar, los datos digitales deben ser representados como un objeto algebraico con una filtración asociada adecuada para calcular su resumen topológico; en segundo lugar, el diagrama de persistencia debe ser transformado con métodos de representación adecuados para ser introducido en un algoritmo de Aprendizaje Automático. Evaluamos el rendimiento de nuestro pipeline y, al mismo tiempo, comparamos los diferentes métodos de representación en conjuntos de datos de referencia populares. Este trabajo es un primer paso hacia un pipeline fácil y listo para usar para la clasificación de datos utilizando homología persistente y Aprendizaje Automático, y para comprender las razones teóricas por las cuales, dada un conjunto de datos y una tarea a realizar, un par (filtración, representación topológica) es mejor que otro.