Résumé :
On peut mesurer la performance d'un système d'apprentissage ou de sélection d'attributs pour toute une plage de compromis entre types d'erreurs (faux positifs vs. faux positifs) en mesurant l'aire sous la courbe ROC. Plus cette aire est élevée et proche de 1, et meilleure et robuste est la performance.
Le stage proposé a pour but de relier l'information que l'on peut gagner avec un nouvel exemple d'apprentissage au gain mesuré par l'aire sous la courbe ROC. Peu d'études ont cherché pour le moment à lier apprentissage et mesure d'information sur un apprentissage.
On appliquera en particulier cette étude au problème de la sélection active d'attributs. Il s'agit d'une approche dans laquelle chaque exemple a un coût proportionnel au nombre d'attributs sur lesquels il est mesuré (e.g. nombre de gènes mesurés sur une puce à ADN). On cherche à minimiser le coût des exemples nécessaires pour sélectionner, avec certaines garanties de précision en probabilité, les attributs pertinents pour une certaine tâche de classification (e.g. gènes utiles pour détecter les cellules cancéreuses).
Le stage comporte à la fois des aspects expérimentaux et des aspects théoriques. Il peut donner suite à un travail de thèse.
| Responsable : | Antoine Cornuéjols |
| Laboratoire : | Laboratoire de Recherche en Informatique (L.R.I.), CNRS UMR 8623 |
| Adresse : | Université de Paris-Sud, 91405 Orsay Cedex |
| Mail : | antoine@lri.fr |
| URL : | http://www.lri.fr/~antoine/Research/sujet-invar-echelle.html |