中国高校财经慕课联盟
分享到:

多维数据分析

 
课程分类: 其他
平台1: FUN
上课时间: 正在授课
课程详情

A PROPOS DU COURS
L'objectif de ce cours est de comprendre et appliquer les quatre méthodes fondamentales de l'analyse des données : analyse en composantes principales, analyse factorielle des correspondances, analyse des correspondances multiples et classification ascendante hiérarchique.
Il a été conçu en vue des applications : une large place est donnée aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l'approche géométrique.
L'objectif est de rendre les participants autonomes dans la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.

A QUI S'ADRESSE CE MOOC ?
Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés : enquêtes d'opinion, marketing, biologie, écologie, géographie, etc.

PRÉ-REQUIS
Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.
Des connaissances de base en statistique sont nécessaires : coefficient de corrélation, test du Chi2, analyse de variance à un facteur.
Enfin, une initiation au langage R est suffisante pour la mise en oeuvre concrète des méthodes.

PLAN DU COURS
Semaine 1 : Analyse en composantes principales

  • Données, notations, exemples

  • Problématique

  • Etude des individus

  • Ajustement du nuage des individus

  • Représentation des variables en tant qu'aide à l'interprétation de la représentation des individus

  • Nuage des variables

  • Aides à l'interprétation

  • Mise en œuvre sous FactoMineR

Semaine 2 : Analyse factorielle des correspondances

  • Données, notations, questions

  • Liaison et indépendance entre deux variables qualitatives

  • Comment l'AFC appréhende-t-elle l'écart à l'indépendance ?

  • Nuage des lignes et nuage des colonnes

  • Représentation des nuages des lignes et des colonnes

  • Interprétation simultanée des lignes et des colonnes

  • Pourcentages d'inertie

  • Inerties (valeurs propres)

  • Aides à l'interprétation

  • Nombre maximum d'axes et V de Cramer

  • Mise en œuvre sous FactoMineR

Semaine 3 : Analyse des correspondances multiples

  • Données

  • Objectifs, problématique

  • Transformation du tableau des données

  • Nuage des individus

  • Représentation des modalités en tant qu'aide à l'interprétation de la représentation des individus

  • Nuage des modalités

  • Représentation simultanée des deux nuages

  • Interprétation des valeurs propres

  • Représentation des variables

  • Aides à l'interprétation

  • Tableau de Burt

  • Mise en œuvre sous FactoMineR

Semaine 4 : Classification

  • Données, définitions

  • Principe de construction d'un arbre hiérarchique

  • Algorithme de partitionnement : les K-means

  • Consolidation des classes

  • Classification sur données de grande dimension

  • Analyse factorielle et classification

  • Caractérisation des classes d'individus

  • Mise en œuvre sous FactoMineR


y1.jpg







中国高校财经E-MOOC联盟   版权所有
copyright @ e-mooc.cn  
联系地址:北京市海淀区阜成路甲28号新知大厦
联系电话:010-8819 1605
公安备案号11010802027127