RamónÁlvarez-Vaz[]ElenaVernazzaMañ[]MargaritaRoldós[]MaurodelaVega

Metodología de Análisis

Se usa parte de la metodología propuesta por \cite{Tsekouras2005} para clasificar atributos categóricos, a través del algoritmo mixto Fuzzy C-modes, y utilizada por \cite{AlvarezVaz2012} para encontrar perfiles de infección parasitaria en escolares de Montevideo. En ambos trabajos cada individuo es previamente clasificado con algún método de clustering y luego pasa por una etapa de difusión, donde pasa a pertenecer a más de un cluster con diferentes grados de participación o membresía. En el método original antes mencionado, se utilizaba el algoritmo k-modes, que es de tipo modal, y que no es más que un caso particular de un un k-prototipo descrito por \cite{Huang1997}. En este caso el algoritmo tiene una lógica de funcionamiento similar a la del algoritmo k-means, y dada la naturaleza de las variables que son binarias, es necesario el uso de otras medidas de disimilaridad, usando un método basado en frecuencias para actualizar los modos \cite{Weihs2005}.
Por lo tanto del método mixto original antes planteado de \cite{Tsekouras2005} se trabaja solamente con el algorimo k-modes que aplica la siguiente disimilaridad, siendo \(x_{i},y_{i}\) 2 individuos de los que se mide los atributos
\begin{equation} \label{eq:2} \label{eq:2}d(x_{i},y_{i})=\sum_{1}^{m}\delta(x_{j},y_{j});\ \ \delta(x_{j},y_{j})=\left\{\par \begin{array}{l,c}0&\text{si}\ \ x_{j}=y_{j}\\ 1&\text{si}\ \ x_{j}\neq y_{j}\end{array}\right\par \\ \end{equation}
El algoritmo trabaja de la siguente manera , a través de 4 pasos:
  1. Selecciona \(k\) modos iniciales, uno para cada clustesfeq:2 con \(x,y\) variables categóricas binarias en este caso, actualizando el modo;
  2. Luego de que todos los individuos han sido asignado, reestima la disimilaridad de los objetos contra el actual modo y si encuentra que un individuo tiene un modo de otro grupo que está más pŕoximo lo reasigna, actualizando los modos de ambos grupos que se modificaron;
  3. Repite el paso 3 hasta que ningún individuo haya cambiado de cluster hasta haber visitado todo el conjunto de datos.
El resultado de este algoritmo es entonces una partición de los individuos en grupos cuyo represente es el perfil modal, es decir la combinación de respuestas que es más frecuente en cada cluster.

Pregunta(s) e hipótesis de investigación

En función de lo planteado en la sección anterior es que la pregunta que se intenta contestar es si el uso de algunas de las HF se asocia con los tributos de las empresas y sus directivos, lo que equivale a plantearse si existen perfiles de uso que diferencien a las prácticas empresariales, y que se podrían resumir en una tipología de uso de las HF, formada por grupos de empresas.
La hipótesis de trabajo entonces es que esa tipología puede ponerse de manifiesto y caracterizarse mediante diferentes aproximaciones metodológicas.
Existe ya una primera experiencia a través de modelos de respuesta discreta (modelos de regresión logística), donde se intentó modelar la propensión al uso de HF en función de características de las empresas y de sus gerentes, con resultados insuficientes, y dado ese antecedente, se propone una alternativa que implica el uso de una técnica estadística descriptiva complementaria y que a su vez supera algunas limitaciones que pueden explicar la pobre performance alcanzada.
En este trabajo el objetivo es obtener perfiles bien diferenciados de uso de las HF en base a los atributos binarios, proponiendo la creación de grupos mediante la estrategia mencionada antes.