ENPC Ecole des ponts
ACCUEIL DU CATALOGUE DES COURS ACCUEIL DU SITE FRANCAIS ACCUEIL DU SITE INTERNATIONAL
Statistiques en grande dimension
Année scolaire 2025-2026
Créneau Sem 4/Sem 6
Sem 6

Aucune

Prérequis

Cours de probabilités de première année (1PROB)

 

Cours d'optimisation de première année (1OPTI)

 

Cours de statistiques de deuxième année (STAT)

Enseignant responsable Badr-Eddine CHERIEF-ABDELLATIF
Equipe enseignante El Mahdi KHRIBCH
Objectifs du module

À l'issue de ce module, les étudiants sauront :

 

1. Comprendre les problèmes principaux posés par la grande dimension en statistique (" fléau de la dimensionnalité "), ainsi que les nombreux bienfaits de la grande dimension (" bénédiction de la dimensionnalité ").

 

2. Sélectionner des méthodes statistiques pertinentes en grande dimension : sparsité, structure de type faible rang, choix du type de régularisation.

 

3. Analyser la performance statistique des principaux estimateurs utilisés en grande dimension.

 

 

4. Implémenter ces méthodes à l'aide de librairies Python, et évaluer la qualité des estimateurs entraînés.

Programme du module

1. Statistique en grande dimension : enjeux et intuition.

 

Phénomènes géométriques et probabilistes contre-intuitifs. " Fléau de la dimension ".

 

2. Modèle de suite gaussienne : un premier cas d'école.

 

Sous-optimalité des estimateurs " naturels ". Shrinkage et paradoxe de Stein.

 

3. Estimation de la moyenne : un deuxième cas d'école.

 

Limites des estimateurs classiques. Robustesse face aux queues lourdes.

 

4. Régularisation et parcimonie : le cas des modèles linéaires.

 

Problèmes mal posés en grande dimension. Moindres carrés et systèmes indéterminés.

 

5. Relaxation convexe : l'estimateur LASSO.

 

Définition et analyse géométrique du LASSO.

 

6. Théorie du LASSO.

 

Analyse théorique de l'estimateur.

 

7. Méthodes à noyaux et espaces de Hilbert.

 

Estimation en grande dimension dans les RKHS. " Bénédiction de la dimension ".

 

8. Sur-paramétrisation et généralisation.

 

Interpolation, double descente, sur-ajustement bénin et régularisation implicite.

Modalités

Deux séances de travaux pratiques de 3h et deux séances de travaux dirigés de 3h auront lieu sur les créneaux du cours. Un devoir sera à effectuer à la maison et à rendre à mi-parcours, un des TPs sera noté, et la validation finale s'effectuera par un projet.

Contrôle des connaissances - Règles de validation du module

25% de l'évaluation finale couvrira le devoir à rendre à mi-parcours, 25% concernera le TP, et les 50% restants correspondront au projet.

Documents pédagogiques - Bibliographie

Des slides serviront de support de cours et seront fournis au fur et à mesure aux étudiants.

Effectif maximal Effectif illimité
Département de rattachement Département Ingénierie Mathématique et Informatique
Nombre de crédits ECTS 3 crédits ECTS
Mise à jour

10 Novembre 2025

Code HISTA
Dernière mise à jour  :  10 Novembre 2025
Rechercher des modules      Liste complète des titres de module      Liste complète des responsables de module
Imprimer © École nationale des ponts et chaussées Haut de page