A PROPOS DU COURS
L'objectif de ce cours est de comprendre et appliquer les quatre méthodes fondamentales de l'analyse des données : analyse en composantes principales, analyse factorielle des correspondances, analyse des correspondances multiples et classification ascendante hiérarchique.
Il a été conçu en vue des applications : une large place est donnée aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l'approche géométrique.
L'objectif est de rendre les participants autonomes dans la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.
A QUI S'ADRESSE CE MOOC ?
Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés : enquêtes d'opinion, marketing, biologie, écologie, géographie, etc.
PRÉ-REQUIS
Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.
Des connaissances de base en statistique sont nécessaires : coefficient de corrélation, test du Chi2, analyse de variance à un facteur.
Enfin, une initiation au langage R est suffisante pour la mise en oeuvre concrète des méthodes.
PLAN DU COURS
Semaine 1 : Analyse en composantes principales
Données, notations, exemples
Problématique
Etude des individus
Ajustement du nuage des individus
Représentation des variables en tant qu'aide à l'interprétation de la représentation des individus
Nuage des variables
Aides à l'interprétation
Mise en œuvre sous FactoMineR
Semaine 2 : Analyse factorielle des correspondances
Données, notations, questions
Liaison et indépendance entre deux variables qualitatives
Comment l'AFC appréhende-t-elle l'écart à l'indépendance ?
Nuage des lignes et nuage des colonnes
Représentation des nuages des lignes et des colonnes
Interprétation simultanée des lignes et des colonnes
Pourcentages d'inertie
Inerties (valeurs propres)
Aides à l'interprétation
Nombre maximum d'axes et V de Cramer
Mise en œuvre sous FactoMineR
Semaine 3 : Analyse des correspondances multiples
Données
Objectifs, problématique
Transformation du tableau des données
Nuage des individus
Représentation des modalités en tant qu'aide à l'interprétation de la représentation des individus
Nuage des modalités
Représentation simultanée des deux nuages
Interprétation des valeurs propres
Représentation des variables
Aides à l'interprétation
Tableau de Burt
Mise en œuvre sous FactoMineR
Semaine 4 : Classification
Données, définitions
Principe de construction d'un arbre hiérarchique
Algorithme de partitionnement : les K-means
Consolidation des classes
Classification sur données de grande dimension
Analyse factorielle et classification
Caractérisation des classes d'individus
Mise en œuvre sous FactoMineR