Les séances sont sur le format suivant : un premier temps d'introduction à une nouvelle notion sur des exemples concrets qui ne correspondent pas forcément au projet, application au projet et ensuite échanges individualisés entre les groupes projets et les encadrants. Cours (15h) - Le contexte des traces numériques de mobilité : questions technologiques, politiques, légales (RGPD), financières, pratiques, enjeux sociétaux… De nombreux exemples sont présentés. (2h) - Les bases de données par la pratique : SQL et SQLite3 (1h30) - Base d'informatique avec Python (1h30) - La bibliothèque Pandas, analyse descriptive (1h30) - Représenter et exploiter les jeux de données (statistiques descriptives) avec Pandas, Matplotlib ou Seaborn (1h30) - interroger des API, automatiser les traitements (1h30) - La base du webscrapping avec BeautifulSoup (1h) - Cartographie des données géo-référencées avec geopandas et folium (1h) - Introduction aux méthodes de machine learning avec Scikit learn (1h30) - Intervention d'un spécialiste opérationnel des traces numériques (2h) Projet (15h) - Formation des groupes de 2 ou 3 élèves - Montage des projets : identification de la problématique et des jeux de données associées. Un jeu de donnée construit à partir d'une API est requis. - Rédaction du cahier des charges du projet - Acquisition des données et exploitation - Présentation graphique et cartographique des résultats - Restitution du projet dans son ensemble (soutenance et rapport) |