Pour ce TP nous allons utiliser l’ACP afin d’analyser les statistiques des joueurs de ligue 1 (selon Fifa2019). Mais avant cela, et comme lors de notre premier TP, nous allons refaire notre analyse sur les données socio-économiques.
Pour récupérer les données c’est par ici.
install.packages("FactoMineR")
puis il faudra ensuite charger cette librairie (ceci on le fera à chaque fois par contre) via
library(FactoMineR)
mypca <- function(data){
n.obs <- nrow(data)
n.var <- ncol(data)
data <- scale(data)## on centre et réduit les données
decomp <- svd(data)
U <- decomp$u
V <- decomp$v
D <- diag(decomp$d)
## Caclul de la proportion de la variance expliquee par axe factoriel
explained.variance.prop <- 1## a vous de faire !
## Coordonnees des individus et des variables sur les axes factoriels
ind.coord <- 1## a vous de faire !
var.coord <- 1## a vous de faire !
## Quelques sorties graphiques
par(mfrow = c(1, 3))
## Graphique de l'évolution de la variance expliquée
barplot(100 * explained.variance.prop)
## Un petit graphique des individus dans le 1er plan factoriel
xlab <- paste("1er axe (", 100 * round(explained.variance.prop[1], 3), "%)", sep = "")
ylab <- paste("2ele axe (", 100 * round(explained.variance.prop[2], 3), "%)", sep = "")
plot(ind.coord[,1:2], xlab = xlab, ylab = ylab, main = "Individus")
abline(h = 0, lty = 2, col = "grey")
abline(v = 0, lty = 2, col = "grey")
## Un petit graphique des variables dans le 1er plan factoriel
plot(0, xlim = c(-1, 1), ylim = c(-1, 1), xlab = xlab, ylab = ylab, main = "Variables",
type = "n")
abline(h = 0, lty = 2, col = "grey")
abline(v = 0, lty = 2, col = "grey")
## on trace le cercle unité
angles <- seq(0, 2 * pi, length = 500)
lines(cos(angles), sin(angles))
arrows(rep(0, ncol(data)), rep(0, ncol(data)), var.coord[,1], var.coord[,2])
text(var.coord[,1], var.coord[,2], colnames(data))
return(list(ind.coord = ind.coord, var.coord = var.coord, explained.variance.prop = explained.variance.prop))
}
Les données sont disponibles ici. Après avoir fait une analyse descriptive de ces données, vous ferez une analyse en composante principale et commenterez vos résultats.
Bon travail !