Français Anglais
Accueil Annuaire Plan du site
Accueil > Production scientifique > Thèses et habilitations
Production scientifique
Doctorat de

Doctorat
Equipe : Apprentissage et Optimisation

Autour De L'Usage des gradients en apprentissage statistique

Début le 01/09/2014
Direction : OLLIVIER, Yann

Ecole doctorale : ED STIC 580
Etablissement d'inscription : Université Paris-Sud

Lieu de déroulement : LRI - AO

Soutenue le 14/12/2017 devant le jury composé de :
Directeur de thèse :
- Yann Ollivier, chercheur à Facebook

Rapporteurs :
- Sébastien Bubeck, chercheur à Microsoft
- Emmanuel Trélat, professeur à l'UPMC

Examinateur :
- Éric Moulines, professeur à l'École Polytechnique

Activités de recherche :

Résumé :
Le résultat principal obtenu est un théorème de convergence locale de l'algorithme classique d'optimisation de système dynamique en temps réel RTRL, appliqué à un système non linéaire. L'algorithme RTRL procède en temps réel, mais doit maintenir en mémoire une grande quantité d'informations, ce qui le rend impropre à entraîner des systèmes d'apprentissage de taille moyenne. L'algorithme NBT y remédie en maintenant une approximation aléatoire non biaisée de faible taille de ces informations. Nous prouvons également la convergence avec probabilité arbitrairement proche de un, de celui-ci vers l'optimum local atteint par l'algorithme RTRL.