RamónÁlvarez-Vaz[]ElenaVernazzaMañ[]MargaritaRoldós[]MaurodelaVega
Resultados
Para el análisis global se trabaja con el software \cite{RcoreTeam2017}, para la determinación de los clusters con el algoritmo presentado en la metodología de la sección \ref{sec:Meto} se usa la librería kmodes \cite{Weihs2005}, donde a través de la función kmodes de determinan los clusters.
En la Tabla \ref{tab:kmodes0} se puede ver como es el comportamiento cambiando de cantidad de clusters, para lo cual se definen 4 escenarios, en los que se presentan varias métricas. Se considera el tamaño en cada grupo, y la métrica withindiff que expresa la distancia de simple matching intracluster, que expresa la cantidad de desacuerdos para todas las variables dentro de cada cluster.
También se construye una métrica que combina las 2 primeras y que se expresa como densidad, relativizando el total de desacuerdos con respecto al total de observaciones dentro de cada cluster. Esta última es un indicador de homogeneidad interna que puede verse como varía y decrece en algún cluster al cambiar la cantidad de grupos que se establece como restricción.
Analizando la densidad puede verse que esta decrece a medida que hay más cantidad de grupos, con lo cual los escenarios 2 y 3 que consideran 3 y 4 grupos parecen ser una buena solución.
En la Figura \ref{fig:perfiles4} y Figura \ref{fig:perfiles5} se ve como es la proporción de las variables a la interna de cada bloque para el escenario 2 y 3 respectivamente, siendo que la opción de 4 grupos la mejor, mostrando grupos que en promedio la cantidad de desacuerdos intracluster es más baja (densidad más baja) que para el caso del escenario 2 con 3 grupos.