OBJECTIFS :

Il s'agit d'un cours d'initiation au data mining descriptif.  A l’issue du cours, l’étudiant aura pris connaissance et assimilé les  méthodes de base de l’analyse des données. Il saura, en outre,  appliquer ces méthodes sur de vraies données à l’aide des logiciels statistiques R et SAS. Plus largement, l’étudiant aura acquis un savoir-faire dans l’exploration de données à l’aide de méthodes statistiques bidimensionnelles et multidimensionnelles.

PLAN DU COURS :

Ce cours est divisé en 5 cours et travaux pratiques (logiciels R et SAS)

  1. Analyse en composantes principales (ACP)
  2. Analyse factorielle des correspondances (AFC )
  3. Analyse factorielle des correspondances Multiples (AFCM)
  4. Classification automatique : agrégation par les moyennes mobiles, classification ascendante hiérarchique
  5. Analyse factorielle discriminante (AFD)

PRE-REQUIS :

1. Statistique descriptive : moyenne, écart-type, corrélations, tableaux croisés

2. Algèbre linéaire : calcul matriciel, valeur propre, vecteur propre,....

BIBLIOGRAPHIE :

Husson François, Sébastien Lê et Jérôme Pagès (2009). L’analyse de données avec R. Presses Universitaires de Rennes.

Saporta Gilbert (2012). Probabilités, Analyse des données et Statistique. Technip.

Tenenhaus Michel (2008). Statistique : méthodes pour décrire, expliquer et prévoir. Dunod.