Français Anglais
Accueil Annuaire Plan du site
Accueil > News du laboratoire > Séminaire de Stuart Russell
Séminaire de Stuart Russell
Séminaire de Stuart Russell Séminaire de Stuart Russell
22 novembre 2010

Stuart Russell, de l'Université de Californie (Berkeley), est invité pour un séminaire qui aura lieu au LRI le 22 novembre à 11h en salle 79.
Tout le monde est bienvenu.

 Title:  Life, play and win in 20 trillion moves

 

Author: Stuart Russell, Computer Science Division, University of California, Berkeley 

 Résumé :

Given the impossibility of perfectly rational behaviour, the concept of bounded optimality provides a more satisfactory formal definition of intelligence; yet still we lack ideas for designing systems that can achieve reasonable decision quality over long time scales.  The talk begins with a classical idea - hierarchical planning with high-level actions of extended duration - and resolves the longstanding open problem of "downward refinement," providing the first algorithms capable of proving that a high-level plan is correct and optimal without considering its concrete implementations.

The classical setting of hierarchical planning is then generalized to that of hierarchical reinforcement learning. I describe a concurrent partial-programming language, ALisp, that may be used to specify constraints on behavior, leaving unspecified those choices that the agent must learn to make on its own. ALisp comes with reinforcement learning algorithms that, in the limit, find the optimal completion of any given partial program. Initial scaling experiments are promising.

Finally, I will briefly explore the implications of this work for research on bounded rationality, metareasoning, and artificial intelligence.

[Joint work with Ron Parr, David Andre, Bhaskara Marthi, Andy Zimdars, David Latham, Carlos Guestrin, Jason Wolfe]

News
George Manoussakis, lauréat 2018, prix de thèse (accessit) Charles Delorme
18 septembre 2018
George Manoussakis, est lauréat de prix de thèse (accessit) Ch. Delorme 2018. Il a soutenu sa thèse au LRI/Galac en Novembre 2017 sous la direction de J. Cohen et A. Deza. Depuis Septembre 2018 il est MdeC à l'Université de Versailles/Li-PaRAD.

TrackML dans Nature
21 janvier 2018
L'apprentissage automatique peut-il aider la physique des hautes énergies à découvrir et à caractériser de nouvelles particules ? TAO participe à l'organisation du challenge TrackML avec le CERN. La seconde phase de la compétition utilisera Codalab.

Un article de Isabelle Guyon sur la démocratisation de l'IA
19 mars 2018
Lien vers l'article paru dans le journal le monde :
http://www.lemonde.fr/acces-restreint/sciences/article/2018/04/08/a4544bd07cad09fe52980c0f82c08b34_5282548_1650684.html