logo móvil
Contáctanos

Reducción Rápida del Tamaño del Conjunto de Entrenamiento Usando Algoritmos de Particionamiento Espacial Simples

Autores: Ougiaroglou, Stefanos; Mastromanolis, Theodoros; Evangelidis, Georgios; Margaris, Dionisis

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Reducción Rápida del Tamaño del Conjunto de Entrenamiento Usando Algoritmos de Particionamiento Espacial Simples


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Algoritmo
Reducción de datos
Datos de entrenamiento
Instancias
Prototipos
Ruido

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El algoritmo de Reducción por Particionamiento Espacial (RSP3) es una técnica de reducción de datos bien conocida. Resume los datos de entrenamiento y genera prototipos representativos. Su objetivo es reducir el costo computacional de un clasificador basado en instancias sin penalizar la precisión. El algoritmo sigue dividiendo los datos de entrenamiento iniciales en subconjuntos hasta que todos ellos se vuelven homogéneos, es decir, contienen instancias de la misma clase. Para dividir un subconjunto no homogéneo, el algoritmo calcula sus dos instancias más distantes y asigna todas las instancias a su instancia más cercana. Esta es una tarea computacional muy costosa, ya que se deben calcular todas las distancias entre las instancias de un subconjunto no homogéneo. Además, el ruido en los datos de entrenamiento conduce a un gran número de pequeños subconjuntos homogéneos, muchos de los cuales tienen solo una instancia. Estas instancias son probablemente ruido, pero el algoritmo genera erróneamente prototipos para estos subconjuntos. Este artículo propone variaciones simples y rápidas de RSP3 que evitan las costosas tareas de particionamiento computacional y eliminan las instancias de entrenamiento ruidosas. El estudio experimental realizado en dieciséis conjuntos de datos y las correspondientes pruebas estadísticas muestran que las variaciones propuestas del algoritmo son mucho más rápidas y logran tasas de reducción más altas que el RSP3 convencional sin afectar negativamente la precisión.

Otros recursos que podrían interesarte

Temas Virtualpro