Comparación de particiones a través del Matching Error

Dia 2019-08-27 14:00:00-03:00
Hora 2019-08-27 14:00:00-03:00
LugarInstituto de Estadística (Eduardo Acevedo 1139)

Comparación de particiones a través del Matching Error

Mathias Bourel (IMERL, FING, UdelaR)

La mayoría de los métodos de clustering dan como resultado una partición del conjunto de datos y, a menudo, una partición del espacio donde se encuentran estos datos. Se pueden usar varios índices para comparar particiones provenientes de un mismo conjunto de datos, entre los cuales el índice Rand, el índice Rand ajustado, el índice Jaccard, etc. La mayoría de ellos carecen de un análisis matemático real, y casi no existe información sobre su distribución.

Consideramos en este trabajo un índice de comparación entre particiones, the Matching Error, inspirado de la tasa de error de clasificación utilizada en el aprendizaje supervisado. Estudiamos sus propiedades con el objetivo de diseñar una prueba de hipótesis para comparar dos particiones.