Recherche

Mes activités de recherches suivent ma formation, et correspondent à une logique d’approfondissement des connaissances en sciences cognitives. J’ai pu appliquer mes connaissances en économie aux sociétés artificielles en étudiant en particulier la négociation entre agents lors de mon stage de DEA. J’ai pu également appliquer le Data Mining à la finance, un domaine qui m’est familier et que j’ai étudié à l’ENS.

En thèse, j’ai combiné ces approches et me suis intéressé à la modélisation de l’agent lui-même en étudiant la combinaison de plusieurs types d’apprentissage (induction, déduction, renforcement). Cette combinaison m’a notamment conduit à utiliser une représentation homogène et réflexive des connaissances, inspirée des concepts fluides de D. Hofstadter (Hofstadter 1995). J’ai également du développer une méthode de Data Mining adaptée à cette représentation utilisant le cadre offert par l’Analyse de Données Symboliques.

Combinaison d’apprentissages dans un agent

L’adaptabilité est un facteur d’efficacité très important pour de nombreux programmes. Ceci est d’autant plus vrai pour un agent, qui peut évoluer dans un monde complexe et inconnu. L’adaptabilité est permise en grande partie par l’apprentissage, qui peut être décomposé en trois sous-types, inductif, déductif et par renforcement. Ces trois apprentissages sont rarement utilisés simultanément, car ils reposent sur des représentations et des traitements des connaissances différents. Or, ils sont complémentaires. Par exemple, pour un robot qui évolue dans un immeuble, l’induction va lui permettre d’extraire le concept de Porte à partir de plusieurs objets observés, il pourra ensuite déduire les actions possibles et les caractéristiques d’une porte (ouvrir, fermer, une porte peut être ouverte par un humain, …), et enfin les concepts et actions utiles seront renforcés pour être utilisés rapidement lorsque les circonstances seront similaires, alors que les concepts et actions moins efficaces seront inhibés pour être éventuellement définitivement oubliés.

Ma thèse porte sur le développement d’un modèle d’agent capable de combiner ces trois formes d’apprentissage. Pour cela, il a fallu adopter une représentation des connaissances commune, compatible avec chacun des apprentissages et permettant de modifier, analyser et exécuter les règles. Pour pouvoir traiter les règles et les autres concepts de façon identique, j’ai utilisé une représentation homogène des connaissances. Une version modifiée des graphes de concepts fluides développés par Douglas Hofstadter a permis d’obtenir la flexibilité et la réflexivité nécessaires. Une fois la représentation des connaissances choisie, j’ai proposé un modèle d’agent adapté permettant de raisonner de façon réflexive, autonome et capable de réaliser les trois types d’apprentissages. Enfin, chacun des apprentissages décrits a du être adapté à la représentation des connaissances et au modèle d’agent. Pour tester le bon fonctionnement du modèle, l’agent a été implémenté et appliqué à une version simplifiée du jeu de Tetris, où il a notamment été possible de vérifier qu’il induisait bien les différentes formes de pièce, déduisait leurs caractéristiques et les règles associées, et renforçait les plus utiles pour oublier les autres.

L’induction a en particulier nécessité l’adaptation des outils de l’Analyse de Données Symboliques (ADS) à notre représentation sous forme de graphe non typé. Des opérateurs de similarité et de fusion ont donc été définis. Une méthode d’extraction adaptée à notre objectif de fonctionnement temps réel a été développée. Un algorithme d’ « individualisation » du nouveau concept appris a de plus été développé. En effet, contrairement aux méthodes d’ADS habituelles, notre objectif n’est pas qu’un utilisateur utilise le résultat de l’analyse pour l’interpréter, mais de le réintroduire dans le graphe de l’agent pour que celui-ci puisse l’utiliser comme ses autres connaissances. L’individualisation recrée ainsi un individu à partir de l’objet symbolique qui modélise le concept extrait.

Enfin, l’évolution permanente du graphe de connaissances de l’agent m’a conduit à développer une méthode de représentation graphique des principaux concepts utilisés et de leur évolution. Cette représentation, basée sur la modélisation de l’ADS sous forme d’objets symboliques, a été généralisée pour pouvoir être appliquée à tout tableau de données symboliques. Elle permet ainsi, à partir d’un tableau de données représentant des individus, d’extraire des concepts pertinents (modélisés par des objets symboliques) et de les représenter sous forme d’hexagones. Si, de plus, les données évoluent dans le temps, la représentation permet de visualiser les évolutions des concepts représentés aussi bien au niveau de leurs caractéristiques internes que de leurs interactions.

Détails

Titre : Modèle ARCO: Apprentissages multiples et Raisonnement réflexif sur des Connaissances hOmogènes
Direction : S. Pinson E.Diday

Fichier (PDF)

Soutenue le 9 décembre 2004 ( Mention très honorable, proposition pour prix de thèse)

Membres du jury:

Professeur Suzanne Pinson (directeur)
Professeur Edwin Diday (directeur)
Professeur Richard Emilion (rapporteur)
Professeur Anne Nicolle (président)
MDC (HDR) Tristan Cazenave (rapporteur)
MDC Sylvie Kornman

École doctorale EDDIMO (Décision, Informatique, Mathématiques et Organisation)

Formations de coalitions entre agents

Une des principales caractéristiques et un des avantages des agents est leur autonomie et leurs objectifs différents, éventuellement opposés. La contrepartie de cet avantage est le problème de coordination qui en découle afin qu’ils puissent interagir et réaliser des tâches complexes. La formation de coalitions est une méthode de coordination particulièrement adaptée dans le cas de tâches nécessitant plusieurs agents. Les principaux protocoles existants nécessitent toutefois une agrégation des préférences des agents. Or, une agrégation nécessite des utilités révélées et comparables, deux hypothèses fortes.

Partant de cette constatation, j’ai proposé un protocole de formation de coalitions ne nécessitant pas d’agrégation des préférences. Comme on ne dispose plus de fonction d’utilité agrégée à maximiser, le protocole cherche une solution optimale au sens de Pareto (c'est-à-dire où on ne peut améliorer la situation d’un individu sans détériorer celle d’au moins un autre). De plus, les protocoles actuels nécessitent d’être réappliqués en entier lorsqu’une condition du monde se modifie. Le protocole proposé permet une restructuration dynamique des coalitions à partir de la solution courante, limitant fortement le temps de calcul moyen. Pour être testé, ce protocole de base a été appliqué à un exemple de formation d’emplois du temps.

L’inconvénient du protocole de base est que son fonctionnement peut conduire à une solution inéquitable (l’objectif étant juste de trouver le plus vite possible une solution Pareto-optimale). Le protocole a donc été étendu pour rechercher une solution plus équitable, toujours sans agrégation ni transmission des préférences. Cette extension, réalisée en collaboration avec S. Aknine (LIP6), s’est faite dans le cadre du projet européen Princip. Ce projet vise à rechercher et identifier les documents racistes et antisémites sur le web. Les agents utilisés correspondent alors à différents critères qui vont se coordonner pour décider du classement d’un document.

Contexte : Mémoire majeur et stage de DEA sous la direction de S. Pinson (2000), travail poursuivi pendant la thèse en collaboration avec S. Aknine (LIP6)

Analyse de données symboliques et données financières

L’analyse de données symboliques (ADS) permet d’étendre le champ d’application et les méthodes de l’analyse de données traditionnelle. En plus d’appliquer ces méthodes à des données non numériques, elle offre un cadre pour le raisonnement sur les concepts analysés. Elle met en particulier l’ « objet symbolique », qui modélise un concept du monde réel, au cœur de l’analyse.

La finance est un domaine d’application idéal pour l’ADS : les données, nombreuses et complexes, sont généralement publiques. Ces avantages m’ont conduit à utiliser le logiciel SODAS pour analyser des données boursières. SODAS est un logiciel prototype public (accessible à www.cisia.com) apte à analyser des données symboliques. Il est issu du projet de EUROSTAT appelé SODAS, comme le logiciel qui en est issu, pour fournir un cadre aux différentes avancées récentes et futures du domaine. 11 laboratoires (dont le CEREMADE) dans 6 pays contribuent à son développement.

Cette application a nécessité notamment la conception de la base de données, le choix des outils d’analyse et des mesures utilisées par SODAS. Elle a permis aussi bien de modéliser les actions que les secteurs boursiers à l’aide d’objets symboliques. J’ai ainsi obtenu des représentations graphiques claires des relations entre ces secteurs (grâce à des ACP sur données symboliques). L’utilisation de méthodes de classifications ont permis de déterminer des sous-groupes et leurs règles de formations. La pertinence des groupes et des règles a été vérifiée par rapport à l’actualité économique de l’époque analysée.

Contexte : Mémoire mineur de DEA sous la direction d’E. Diday (2000)