ROUGH DRAFT authorea.com/5620
Main Data History
Export
Show Index Toggle 0 comments
  •  Quick Edit
  • Compte Rendu TP3

    Objectif :

    Effectuez l’analyse en composantes principales normée (ACP). On considère pour cela les taux de croissancedu PIB réels des pays pour différentes années.

    Travail réalisé :

    ACP :

    L’ACP (Analyse en composantes principales) permet de décrire un jeu de données, de le résumer, d’en réduire la dimensionnalité. L’ACP réalisée sur les individus du tableau de données répond á différentes questions :Etude des individus : étude de variabilité entre individus,de similarités entre les individus pour toutes les variables, établissement de profils.Etude des variables : étude des liaisons linéaires entre les variables. Les objectifs sont de résumer la matrice des corrélations et de chercher des variables synthétiques. Ensuite étudier la possibilté de caractériser des groups d’individus par des variables. Pour cela, on installe le package FactoMineR.linktext

    [h] image \label{fig:image1}

    Matrice de corrélation:

    Ensuite, on enregistre la table des données dans un fichier “tp3.cvs”. On utilise la commande read.table pour lire la table. On y applique la fonction permettant de créer la matrice de corrélation entre les différentes variables de la table. La matrice des corrélations est tout simplement la matrice des coefficients de corrélation calculés les variables prises deux è deux pour pouvoir par la suite calculer par des lois statistiques l’influence des variables les unes sur les autres. Les coefficients indiquent l’influence que les variables ont les unes sur les autres. Par exemple si on prend a diagonale, elle est constituée de 1 puisque la corrélation d’une variable avec elle-même est parfaite.

    [h] image \label{fig:image2}

    Valeurs propres:

    On applique l’ACP et récupérant le résultat, Toutes les opérations qui suiveront seront appliquées á cet objet selon des paramétres. D’apèrs la dernière colonne “cumulative percentage of variance”, appelée aussi inertie, on retient les axes important : dans notre cas les axes donnés par les 4 premières valeurs.

    [h] image \label{fig:image3}

    [h] image \label{fig:image6}

    Corrélation entre variables et axes:

    On calcule les vecteurs propres de la matrice de corrélation entre les variables et les axes retenus.

    [h] image \label{fig:image7}

    Cordonnéées des observations:

    Les coordonnées des observations et des variables sont simplement les projections sur les vecteurs propres(composante principale).

    [h] image \label{fig:image8}

    Cosinus carré des observations:

    L’ACP revient à effectuer une rotation du sytème d’axes initial puisque les vecteurs propres sont orthogonaux entre eux et constituent donc un nouveau repère de coordonnées. Les cosinus entre les nouveaux axes et les anciens sont les composantes des vecteurs propres. L’analyse des cosinus carrés permet alors d’éviter des erreurs d’interprétation dues à des effets de projection. Si les cosinus carrés associés aux axes utilisés sur un graphique sont faibles, on évitera d’interpréter la position de l’observation ou de la variable en question.

    [h] image \label{fig:image9}

    Contribution des observations:

    La contribution des observations vise à quantifier l’importance de chaque variable et de chaque observation dans la définition d’un vecteur propre. La contribution est donnée par la coordonnée (au carré) d’une observation ou d’une variable sur un vecteur propre divisée par la valeur propre associée à ce vecteur propre. Pour les variables, il suffit de prendre les éléments, au carré, des vecteurs propres.

    [h] image \label{fig:image10}

    Nous avons obtenus jusque là à partir de la matrice des données, les coordonnées des projetés des individus dans la base orthonormée des vecteurs propres de la matrice des corrélations. Nous allons maintenant représenter le nuage projeté du nuage initial de poids et le cercle des corrélations dans le plan formé par deux composantes qu’on variera. Aussi on s’intéresse à la qualité de la représentation des individus par le cosinus de l’angle entre le vecteur et son projeté sur le plan factoriel considéré.

    [h] image \label{fig:image11}

    De point de vue variable, le cercle de corrélation entre l’axe 1 et 2 montre une forte corrélation entre les taux de croissance des années 2002 et 2008.

    [h] image \label{fig:image12}

    [h] image \label{fig:image13}

    De même pour les axes 3 et 4.L’axe 3 est correlés aux variables 1997 et 1998. L’axe 4 n’est correlé à aucune variable.

    [h] image \label{fig:image15}

    [h] image \label{fig:image16}

    De même pour les axes 1 et 5. L’axe 5 est correlé positivement et fortement à 2005; faiblement et négativement à 2001.

    [h] image \label{fig:image18}

    [h] image \label{fig:image19}