Détails du cours MAE61

Statistical learning

Cette page est essentiellement destinée aux enseignants et regroupe toutes les informations nécessaires à la gestion d'un cours ENSTA.

Identité du cours

Sigle : MAE61
Titre français : Apprentissage statistique
Titre anglais : Statistical learning
Méta infos : modifiée le : 31/03/2017   par : guest   Nb de visiteurs : 4   annee : 2A      periode : 1      Rattachement/module : ModEl      ECTS : 3      type : unknown     
ouvert : Oui     modif. autorisée : Oui     email auto. au responsable : Oui     à évaluer : Oui     en ligne : Non    
domaine ParisTech : 1,1c    

Equipe pédagogique

Responsable (login) :
Professeur principal :
Professeurs participants : Christine KERIBIN,   
Maitres de conférences :

Contenu

a pour prérequis : - MAP-STA1 (Modélisation Statistique)
- MA101
Objectifs :

1. Descriptif

L'apprentissage statistique développe un ensemble de méthodes et algorithmes pour extraire des informations pertinentes à partir de données de plus en plus volumineuses. En apprentissage supervisé, la variable réponse est à expliquer ou prédire en fonction des variables explicatives ou prédicteurs. En apprentissage non supervisé, aucune variable n'est particularisée, et il s’agit de construire à partir de leur ensemble un modèle permettant de représenter au mieux les observations. La première partie du cours (apprentissage non supervisé) abordera les méthodes factorielles (Analyse en composantes principales, Analyse factorielle de correspondances, ACM) et les méthodes de classification non supervisée (clustering) La deuxième partie développera les problématiques et méthodes d'apprentissage supervisé: régression (linéaire, nonlinéaire, régression logistique, modèles linéaires généralisés), arbres de décision, régularisation en régression multiple, choix de modèle. Les concepts théoriques seront mis en application dans des TDs informatiques avec un logiciel statistique. Remarque: ce cours compte pour 4 ECTs pour l'obtention du M1-Mathématiques Appliquées

2.Compétences à acquérir

A l'issue du cours, l'étudiant doit être capable de : - Faire la différence entre situation supervisée et non supervisée - Décrire le principe des méthodes factorielles et savoir les appliquer - Choisir une modélisation adaptée à un problème posé - Valider la performance d'une méthode - Mettre en oeuvre la sélection de variables - Utiliser un logiciel statistique pour mettre en oeuvre la méthode choisie - Interpréter et discuter les résultats - Appréhender un nouveau type de modèle ou de logiciel en autonomie - Rédiger un rapport sous forme informatique pour rendre compte d'une étude statistique

3. Programme des séances

- Principes de l'ACP - Dualité en ACP - Interprétations - AFC - Classification non supervisée - Cas d'étude et partiel - Régression paramétrique non linéaire. Principes et estimation - Asymptotique de la régression non linéaire. Tests - Régression logistique - Classification supervisée - Choix de modèle et sélection de variables - Régularisation - Examen
Mots clés : Apprentissage statistique
Objectives : Statistical learning
Keywords : Statistical learning
Supports :
Biblio : Analyse de données avec R. F. Husson, S. Lê, J. Pagès. PUR (2009)

An introduction to generalized linear models. A. Dobson. Chapman & Hall (2002)

Statistical tools for non linear models. S. Huet, A. Bouvier, M-A. Poursat, E.
Jolivet. Springer (2003)

An introduction to statistical learning with applications in R. G. James, D.
Witten, T. Hastie, R. Tibshirani, Springer (2014).
Contrôle : Un examen partiel à l'issue de la partie non supervisée (EP)
Un examen final (EX)
Un mini projet (PR)
note = (2*EP + EX + 2* PR)/5

Besoins particuliers et remarques éventuelles

Moyens :
Commentaires :

Séances

mar. 21 mars 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Principes de l'ACP
besoin : Vidéo,
Intervenants : Christine KERIBIN,
ven. 24 mars 2017   - 13:30 à 17:00 : Bloc de Module en salle Info (MODI)
programme : Dualité en ACP - Interprétations
besoin : Vidéo,
Intervenants : Christine KERIBIN,
mar. 28 mars 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : AFC
besoin : Vidéo,
Intervenants : Christine KERIBIN,
ven. 31 mars 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Classification non supervisée
besoin : Vidéo,
Intervenants : Christine KERIBIN,
mar. 04 avril 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Cas d'étude et partiel
besoin : Vidéo,
Intervenants : Christine KERIBIN,
ven. 07 avril 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Régression paramétrique non linéaire. Principes et estimation
besoin : Rétro,
Intervenants : Christine KERIBIN,
mar. 18 avril 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Asymptotique de la régression non linéaire. Tests
besoin : Vidéo,
Intervenants : Christine KERIBIN,
ven. 21 avril 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Régression logistique
besoin : Vidéo,
Intervenants : Christine KERIBIN,
mar. 25 avril 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Classification supervisée
besoin : Vidéo,
Intervenants : Christine KERIBIN,
ven. 28 avril 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Choix de modèle et sélection de variables
besoin : Vidéo,
Intervenants : Christine KERIBIN,
mar. 02 mai 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Régularisation
besoin : Vidéo,
Intervenants : Christine KERIBIN,
ven. 05 mai 2017   - 9:00 à 12:30 : Bloc de Module en salle Info (MODI)
programme : Examen
besoin : Vidéo,
Intervenants : Christine KERIBIN,