|
|
PROGRAMME
SEMAINE 0 (DAtes de suivi recommandées dU 06/06 À 10H AU 12/06 À 10H)
Quiz de pré-requis
- 5 questions sur les bases de la programmation,
- 5 questions sur les prérequis d’algèbre,
- 5 questions sur les prérequis d’analyse,
- 5 questions sur les prérequis de probabilités,
- 5 questions sur les prérequis de statistiques,
- 5 questions sur les bases de données relationnelles.
Introduction
Objectif
Identifier les besoins en mathématiques, en programmation et en bases de données pour les formations préparant aux métiers du Big Data.
Contenu
[Vidéo 1] : Introduction, Stéphan Clémençon (5:08)
SEMAINE 1 (dAtes de suivi recommandées du 12/06 à 10H au 19/06 à 10h heure de paris)
Programmation Python Partie 1- Alexandre Gramfort
Objectifs
- Utiliser l’environnement (ainsi que l’interpréteur) Python pour écrire et exécuter des programmes.
- Utiliser la bibliothèque standard Python et ses modules dans des programmes de base.
- Utiliser les conteneurs, les branchements et les boucles dans des programmes Python.
- Utiliser les fonctions dans l’écriture des programmes Python.
- Écrire des programmes Python orientés objet en utilisant les classes et leurs méthodes.
Contenu
[Vidéo 1] : Prise en main de l’environnement Python (7:37)
[Vidéo 2] : Les modules et la notion d’import (4:37)
[Vidéo 3] : Les conteneurs : chaînes de caractères et listes (10:40)
[Vidéo 4] : Les conteneurs : tuples et dictionnaires (3:30)
[Vidéo 5] : Branchements et boucles (5:30)
[Vidéo 6] : Les fonctions (5:30)
[Vidéo 7] : Classes et objets (6:35)
[Quiz]
[Discussions]
Algèbre Partie 1 - Anne Sabourin
Objectifs
- Identifier et manipuler un espace vectoriel réel Identifier et manipuler un espace vectoriel engendré par une famille finie Identifier et manipuler une base.
- Calculer et utiliser la dimension d’un espace vectiriel réel.
- Calculer et utiliser le rang d’une famille de vecteurs Identifier si une famille de vecteurs est libre ou liée et utiliser ses caractéristiques Identifier et manipuler une application linéaire et ses propriétés selon les cas (composition, injectivité, surjectivité, inverse).
- Utiliser le noyau d’une application linéaire.
- Utiliser le théorème du rang pour caractériser l’inversibilité d’une application linéaire.
- Identifier le lien entre une application linéaire et une matrice.
- Identifier et utiliser la base canonique.
- Réaliser des opérations sur les matrices (produits, inverse, transposition, changement de base).
Contenu
[Vidéo 1] : Analyse des données et algèbre linéaire (12:15)
[Vidéo 2] : Matrices et applications linéaires (12:41)
[Quiz]
[Discussions]
SEMAINE 2 (dATEs DE SUIVI RECOMMANDées du 19/06 à 10h au 26/06 à 10h heure de paris)
Les limites des bases de données relationnelles - Pierre Senellart
Objectifs
- Identifier les forces et les faiblesses des SGBD relationnels classiques pour savoir dans quels cas les utiliser ou préférer d’autres systèmes.
- Connaître les différents types de données dans les systèmes NoSQL et leurs particularités.
- Identifier les caractéristiques des systèmes clé-valeur, des systèmes orientés document, des systèmes orientés colonnes et en connaître quelques exemples.
- Identifier les avantages de l’utilisation des systèmes NewSQL.
Contenu
[Vidéo 1] : SGBD relationnels classiques: forces et faiblesses (5:56)
[Vidéo 2] : NoSQL (5:34)
[Vidéo 3] : NewSQL (2:22)
[Quiz]
[Discussions]
Programmation Python Partie 2 - Alexandre Gramfort
Objectifs
- Importer les bibliothèques Numpy et Matplotlib pour le calcul scientifique en Python en fonction des besoins.
- Créer des tableaux avec Numpy.
- Manipuler les tableaux et utiliser les attributs shape, ndim, size, dtype, etc.
- Faire de l’arithmétique sur les tableaux.
- Générer des données aléatoires avec Numpy.
- Créer des matrices.
- Lire et écrire dans un fichier.
- Résoudre des problèmes d’algèbre linéaire avec Numpy (opérations d’addition, de multiplication sur des matrices, réduction de matrice, copie, changement de dimension, concaténation).
Contenu
[Vidéo 1] : Découverte de NumPy et Matplotlib (7:05)
[Vidéo 2] : Prise en main de NumPy (6:59)
[Vidéo 3] : Arithmétique avec NumPy, nombres aléatoires et fonctions de base (6:04)
[Vidéo 4] : Entrée-Sortie et indexation avec NumPy (8:25)
[Vidéo 5] : Algèbre linéaire et opérations de réduction (5:53)
[Vidéo 6] : Copies, changement de dimensions et concaténation (3:46)
[Quiz]
[Discussions]
Algèbre Partie 2 - Anne Sabourin
Objectifs
- Manipuler le produit scalaire et en connaître l'intérêt et les propriétés.
- Manipuler les normes.
- Utiliser l’inégalité de Cauchy-Schwartz.
- Comprendre l’orthogonalité, de vecteurs, de sous-espaces, de matrices et la propriété induite d’invariance.
- Utiliser les projections.
- Identifier si une matrice est diagonalisable et pouvoir la diagonaliser (dans le cas des matrices symétriques et dans le cas général).
- Identifier l’intérêt et les cas d’utilisation de la réduction de matrice.
- Manipuler la Décomposition en Valeurs Singulières, l’utiliser dans Python et en connaître des cas d’applications.
Contenu
[Vidéo 1] : Géométrie (9:44)
[Vidéo 2] : Réduction des matrices (9:44)
[Quiz]
[Discussions]
SEMAINE 3 (dATEs DE SUIVI RECOMMANDéES DU 26/06 à 10h au 03/07 à 10h heure de Paris)
Probabilités Partie 1 - Anne Sabourin
Objectifs
- Connaître ce qu’est un univers, un univers discret, un élément, un évènement.
- Faire des opérations sur les ensembles (union, intersection, etc.).
- Manipuler les probabilités discrètes et en connaître les propriétés.
- Manipuler le conditionnement et les probabilités conditionnelles.
- Identifier les évènements indépendants en fonction de certaines propriétés.
- Manipuler une variable aléatoire discrète et la loi qu’elle détermine (exemple : Variable aléatoire de Bernoulli) ainsi qu’un vecteur aléatoire discret.
- Utiliser les lois conditionnelles.
- Effectuer des transformations de variable aléatoires et déterminer la loi de la transformée.
- Comprendre et calculer l'espérance d’une variable aléatoire discrète.
- Utiliser le théorème de changement de variable.
- Maîtriser les propriétés de l’espérance (linéarité, monotonie).
- Comprendre et calculer l’espérance conditionnelle.
Contenu
[Vidéo 1] : Probabilités discrètes (15:33)
[Vidéo 2] : Variables aléatoires discrètes (15:19)
[Vidéo 3] : Espérance, espérance conditionnelle (12:55)
[Quiz]
[Discussions]
Analyse Partie 1 - Joseph Salmon
Objectifs
- Comprendre la dérivée d’une fonction, en connaître les caractéristiques et faire le lien avec la tangente.
- Comprendre et calculer les dérivées partielles d’une fonction multi-dimensionnelle, faire le lien avec le gradient, comprendre l’interprétation tangentielle.
- Utiliser l’approximation quadratique.
- Appréhender les ensembles convexes et en connaître quelques exemples.
- Connaître les fonctions convexes et strictement convexes et leurs propriétés et en identifier quelques exemples.
- Connaître les propriétés du problème d’optimisation qu’est la minimisation.
- Identifier les méthodes de résolution de systèmes sous forme matricielle.
- Utiliser le théorème de coercivité.
- Connaître les cas où une fonction admet un minimum local, identifier le cas où la fonction est convexe.
- Utiliser la règle de Fermat.
Contenu
[Vidéo 1] : Calcul différentiel pour une ou plusieurs variables (8:16)
[Vidéo 2] : Convexité et fonctions convexes (6:17)
[Vidéo 3] : Optimisation sans contrainte (8:08)
[Quiz]
[Discussions]
Semaine 4 (dATEs DE SUIVI RECOMMANDées DU 03/07 à 10h au 10/07 à 10h heure de Paris)
Probabilités Partie 2 - Anne Sabourin
Objectifs
- Déterminer si deux variables aléatoires sont indépendantes et utiliser les propriétés en découlant.
- Déterminer si une variable aléatoire a un carré sommable et en calculer la variance.
- Calculer l’espérance d’un vecteur aléatoire.
- Calculer la covariance d’un couple de variables aléatoires, particulièrement dans le cas où elles sont indépendantes.
- Utiliser l’inégalité de Cauchy-Schwartz.
- Déterminer la matrice de covariance d’un vecteur aléatoire et en connaître les propriétés.
- Connaître les propriétés du cadre continu.
- Connaître la loi normale.
- Calculer l’espérance d’une variable aléatoire continue, d’une transformée.
- Calculer la variance d’une variable aléatoire continue, d’une variable gaussienne.
- Connaître les propriétés du cadre continu multivarié.
- Identifier un vecteur aléatoire continu.
- Calculer les densités marginales, densité conditionnelle.
- Connaître la loi conditionnelle, l’utiliser.
- Calculer l’espérance conditionnelle.
- Utiliser les vecteurs gaussiens, en connaître les propriétés dans le cas d’indépendance.
- Manipuler l’exemple de la densité gaussienne.
Contenu
[Vidéo 1] : Espérance, espérance conditionnelle (11:47)
[Vidéo 2] : Variables aléatoires continues (10:52)
[Vidéo 3] : Vecteurs aléatoires continus (15:58)
[Quiz]
[Discussions]
Analyse Partie 2 - Joseph Salmon
Objectifs
- Utiliser le théorème de Weierstrass pour déterminer l’existence d’un minimum.
- Utiliser le théorème de condition du premier ordre (cas contraint).
- Utiliser le théorème de projection sur les ensembles convexes fermés.
- Utiliser les conditions KKT pour la résolution d’un problème d’optimisation.
- Utiliser les conditions de Slater pour la résolution d’un problème d’optimisation.
- Utiliser l’algorithme de la descente de gradient pour déterminer le minimum d’une fonction.
- Utiliser la règle d’Armijo.
- Utiliser la méthode de Newton.
Contenu
[Vidéo 1] : Optimisation avec contrainte (8:26)
[Vidéo 2] : Algorithme pour l'optimisation sans contrainte (9:52)
[Quiz]
[Discussions]
Semaine 5 (dates de suivi recommandées du 10/07 à 10H au 17/07 à 10h heure de Paris)
Statistique - Joseph Salmon
Objectifs
- Connaître les définitions et le vocabulaire de base (Estimation, Prédiction, Échantillon, etc.).
- Calculer la moyenne et une médiane pour un ensemble d’observations.
- Calculer la variance et l’écart-type empiriques d’un ensemble d’observations.
- Calculer la déviation médiane absolue.
- Utiliser l’histogramme pour approcher la densité.
- Utiliser la fonction de répartition empirique.
- Calculer le quantile d’ordre p.
- Calculer la covariance et la corrélation empiriques.
- Connaître les définitions de modèle statistique et modèle statistique empirique.
- Étudier le cas gaussien.
- Calculer l’estimateur à partir d’un échantillon, en connaître les propriétés.
- Calculer le risque empirique d’un estimateur.
- Déterminer l’intervalle de confiance.
- Utiliser le théorème central limite.
- Évaluer les tests d’hypothèse.
- Utiliser le modèle de régression.
- Utiliser l’estimateur de moindres carrés dans les cas uni-dimensionnel et multi-dimensionnel.
Contenu
[Vidéo 1] : Statistiques descriptives (7:55)
[Vidéo 2] : Estimation : modèle statistique, notion d’estimateur, biais / variance (7:31)
[Vidéo 3] : Intervalles de confiance et tests (7:43)
[Vidéo 4] : Modèle de regression linéaire (6:47)
[Quiz]
[Discussions]
Semaine 6 (DATEs DE SUIVI RECOMMANDées du 17/07 à 10H au 24/07 à 12H HEURE DE PARIS)
- Appréhender la notion de classification binaire.
- Connaître les propriétés de la minimisation du risque empirique.
- Déterminer l’hyperplan séparateur.
- Utiliser l’algorithme du perceptron dans un problème de classification.
[Vidéo 1] : Le classifieur Perceptron (5:24)
[Quiz]
[Discussion]
[Activité] : Mini-projet
En quoi consiste-t-il ?
Utiliser la librairie Numpy de Python pour calculer l’estimateur de moindres carrés et les résidus sur une base de données réelle fournie.
Objectifs d’apprentissage
Programmer un estimateur, en l’occurrence celui de moindres carrés, en Python. Manipuler une base de données réelles.
Déroulé
L’énoncé du mini-projet sera disponible dès le 06/06 à 10h et les réponses aux deux questions devront être validées au plus tard le 01/08 à midi.
[Discussion]
[Conclusion]
[Questionnaire de satisfaction]