Proposition de stage de DEA ou d'ingénieur

2005-2006

Titre : "Mise en oeuvre de méthodes d'apprentissage pour la prédiction de bioactivité de molécules"


Résumé :

Le criblage automatisé de collections de molécules (chimiothèques) est utilisé dans l'industrie pharmaceutique pour découvrir des molécules "bio-actives", c'est-à-dire ayant une action sur certains processus biologiques et susceptibles de conduire à de nouveaux médicaments. Un criblage consiste à fournir à un système une description des molécules afin que le système prédise sa bioactivité. Il s'agit d'un problème très difficile car dans l'état actuel des connaissances on ne sait pas vraiment quelles sont les caractéristiques pertinentes des molécules contrôlant leur bio-activité. Par ailleurs, très peu de molécules sont bio-actives sur un processus donné. L'approche actuelle est d'essayer des techniques d'apprentissage artificiel pour essayer à la fois de découvrir les descripteurs adéquats et de trouver une fonction d'évaluation de la bio-activité des molécules testées.

Le sujet de ce stage consiste à essayer des techniques d'apprentissage, telles les SVM, le boosting, l'induction de programmes logiques sur les descriptions de molécules disponibles dans une base de données.

Le stagiaire doit être à l'aise en programmation C, java, éventuellement MatLab, afin de pouvoir réaliser facilement de nombreuses expériences.

Ce stage s'inscrit dans un projet inter-équipes en France. Il peut déboucher sur un travail de thèse.


Responsable : Antoine Cornuéjols
Laboratoire : Laboratoire de Recherche en Informatique (L.R.I.), CNRS UMR 8623
Adresse : Université de Paris-Sud, 91405 Orsay Cedex
Mail : antoine@lri.fr
URL : http://www.lri.fr/~antoine/Research/sujet-opti-sys-distribue.html