The MediaD Project
MediaD stands for Médiation Distribuée de Connaissances et de Données (in french), i.e., Distributed Mediation of Knowledge & Data.


Summary of the project
MediaD is a three year project (2005-04-12 to 2008-04-12) with France Telecom R&D (better known worldwide as Orange R&D).

The purpose of MediaD is to investigate distributed reasoning in a peer-to-peer setting.

The roadmap of MediaD is:
  1. The design of a scalable peer-to-peer infrastructure for efficient distributed reasoning, 
  2. The design of peer data management systems for the Semantic Web (and their query answering algorithms) that uses the above infrastructure, and
  3. The design of algorithms for automated ontology mapping in the above peer data management systems.


Members of the project

Project coordinators
Permanent members
PhD students

Summary of the results

Peer-to-peer infrastructure for efficient distributed reasoning

Calcul de conséquences pour le test d'extension conservative dans un système pair-à-pair par Nada Abdallah et François Goasdoué. 4ème Journées Francophones de Programmation par Contraintes (JFPC), 2008.

Dans un système d'inférence pair-à-pair (P2PIS), un pair étend sa base de connaissances (KB) avec celles des autres pairs afin d'utiliser leurs connaissances pour répondre aux requêtes qui lui sont posées. Toutefois, l'extension d'une KB n'est pas nécessairement conservative. Une extension conservative garantit que le sens d'une KB est le même lorsqu'elle est considérée seule ou avec son extension. En revanche, une extension non conservative peut changer radicalement le sens d'une KB au sein de la théorie résultante. Il est par conséquent crucial pour un pair de savoir si un P2PIS est une extension conservative de sa KB. En effet, si ce n'est pas le cas (i) ses utilisateurs n'ont plus la bonne interprétation de sa KB, donc des requêtes en termes de sa KB et des réponses à celles-ci et (ii) les connaissances qu'il fournit aux autres pairs ne sont pas celles escomptées. Cet article est le premier à s'intéresser à la notion d'extension conservative dans le cadre des P2PIS. Notre contribution est d'étudier théoriquement et algorithmiquement le problème de tester si un P2PIS propositionnel est une extension conservative d'un pair donné. En particulier, nous recourons au calcul de conséquences afin de reformuler ce problème et d'élaborer un algorithme décentralisé pour le résoudre.

Calcul de conséquences dans un système d'inférence pair-à-pair propositionnel (revisité) by Nada Abdallah and François Goasdoué. Reconnaissance des Formes et Intelligence Artificielle (RFIA), 2008.

Dans cet article, nous étudions le calcul de conséquences dans les systémes d'inférence pair-à-pair (P2PIS) propositionnels avec des mappings orientés. Dans ces systémes, un mapping allant d'un pair vers un autre spécifie un ensemble de connaissances que le premier pair doit observer, ainsi que les connaissances qu'il doit notifier au second pair si les connaissances observées sont satisfaites. Ces nouveaux P2PIS pouvant modéliser de nombreuses applications réelles, il est important de les doter d'inférences clés de l'IA, en l'occurrence du calcul de conséquences. Nos contributions sont doubles. Nous définissons tout d'abord le premier cadre logique pour représenter des P2PIS propositionnels avec des mappings orientés. Nous étudions ensuite le calcul de conséquences dans ce nouveau cadre. En particulier, nous proposons un algorithme totalement décentralisé pour ce probléme.

Reasoning with Inconsistencies in Propositional Peer-to-Peer Inference Systems by Philippe Chatalic, Gia-Hien Nguyen, Marie-Christine Rousset. European Conference on Artificial Intelligence (ECAI), 2006.

In a peer-to-peer inference system, there is no centralized control or hierarchical organization: each peer is equivalent in functionality and cooperates with other peers in order to solve a collective reasoning task. Since peer theories model possibly different viewpoints, even if each local theory is consistent, the global theory may be inconsistent. We exhibit a distributed algorithm detecting inconsistencies in a fully decentralized setting. We provide a fully distributed reasoning algorithm, which computes only well-founded consequences of a formula, i.e., with a consistent set of support.

Distributed Reasoning in a Peer-to-Peer Setting: Application to the Semantic Web by Philippe Adjiman, Philippe Chatalic, François Goasdoué, Marie-Christine Rousset and Laurent Simon. Journal of Artificial Intelligence Research, Vol. 25, pages 269-314, 2006.

In a peer-to-peer inference system, each peer can reason locally but can also solicit some of its acquaintances, which are peers sharing part of its vocabulary. In this paper, we consider peer-to-peer inference systems in which the local theory of each peer is a set of propositional clauses defined upon a local vocabulary. An important characteristic of peer-to-peer inference systems is that the global theory (the union of all peer theories) is not known (as opposed to partition-based reasoning systems). The main contribution of this paper is to provide the first consequence finding algorithm in a peer-to-peer setting: it is anytime and computes consequences gradually from the solicited peer to peers that are more and more distant. We exhibit a sufficient condition on the acquaintance graph of the peer-to-peer inference system for guaranteeing the completeness of this algorithm. Another important contribution is to apply this general distributed reasoning setting to the setting of the Semantic Web through the somewhere semantic peer-to-peer data management system. The last contribution of this paper is to provide an experimental analysis of the scalability of the peer-to-peer infrastructure that we propose, on large networks of 1000 peers.

Scalability Study of Peer-to-Peer Consequence Finding by Philippe Adjiman, Philippe Chatalic, François Goasdoué, Marie-Christine Rousset and Laurent Simon. International Joint Conference on Artificial Intelligence (IJCAI), 2005.

In peer-to-peer inference systems, each peer can reason locally but also solicit some of its acquaintances, sharing part of its vocabulary. This paper studies both theoretically and experimentally the problem of computing proper prime implicates for propositional peer-to-peer systems, the global theory (union of all peer theories) of which is not known (as opposed to partition-based reasoning).

Distributed Reasoning in a Peer-to-peer Setting by Philippe Adjiman, Philippe Chatalic, François Goasdoué, Marie-Christine Rousset et Laurent Simon. European Conference on Artificial Intelligence (ECAI'04), pages 945-946 (accepted as a short paper), 2004.

In a peer-to-peer inference system, each peer can reason locally but can also solicit some of its acquaintances, which are peers sharing part of its vocabulary. In this paper, we consider peer-to-peer inference systems in which the local theory of each peer is a set of propositional clauses defined upon a local vocabulary. An important characteristic of peer-to-peer inference systems is that the global theory (the union of all peer theories) is not known (as opposed to partition-based reasoning systems). The contribution of this paper is twofold. We provide the first consequence finding algorithm in a peer-to-peer setting: it is anytime and computes consequences gradually from the solicited peer to peers that are more and more distant. We exhibit a sufficient condition on the acquaintance graph of the peer-to-peer inference system for guaranteeing the completeness of this algorithm. We also present first experimental results that are promising.

Raisonnement distribué dans un environnement de type Pair-à-Pair by Philippe Adjiman, Philippe Chatalic, François Goasdoué, Marie-Christine Rousset et Laurent Simon. Actes des dixièmes Journées Nationales sur la résolution Pratique de Problèmes NP-Complets (JNPC'04), pages 11-22, 2004.

Dans un système d'inférence pair-à-pair, chaque pair peut raisonner localement mais peut également solliciter son voisinage constitué des pairs avec lesquels il partage une partie de son vocabulaire. Dans cet article, on s'intéresse aux systèmes d'inférence pair-à-pair dans lesquels la théorie de chaque pair est un ensemble de clauses propositionnelles construites à partir d'un vocabulaire local. Une caractéristique importante des systèmes pair-à-pair est que la théorie globale (l'union des théories de tous les pairs) n'est pas connue (par opposition aux systèmes de raisonnement fondés sur le partitionnement). La contribution de cet article est double. Nous exposons le premier algorithme de calcul d'impliqués dans un environnement pair-à-pair : il est anytime et calcule les impliqués progressivement, depuis le pair interrogé jusqu'aux pairs de plus en plus distants. Nous énonçons une condition suffisante sur le graphe de voisinage du système d'inférence pair-à-pair, garantissant la complétude de notre algorithme. Nous présentons également quelques résultats expérimentaux prometteurs.


Peer data management systems for the Semantic Web

SomeRDFS in the Semantic Web by Philippe Adjiman, François Goasdoué, and Marie-Christine Rousset. Journal on Data Semantics, No 8, pages 158-181, Springer Journal (LNCS 4380), 2007.

The Semantic Web envisions a world-wide distributed architecture where computational resources will easily inter-operate to coordinate complex tasks such as query answering. Semantic marking up of web resources using ontologies is expected to provide the necessary glue for making this vision work. Using ontology languages, (communities of) users will build their own ontologies in order to describe their own data. Adding semantic mappings between those ontologies, in order to semantically relate the data to share, gives rise to the Semantic Web: data on the web that are annotated by ontologies networked together by mappings. In this vision, the Semantic Web is a huge semantic peer data management system. In this paper, we describe the SomeRDFS peer data management systems that promote a "simple is beautiful" vision of the Semantic Web based on data annotated by RDFS ontologies.

SomeWhere: a scalable P2P infrastructure for querying distributed ontologies by Marie-Christine Rousset, Philippe Chatalic, Philippe Adjiman, Philippe Chatalic, Francois Goasdoué, Laurent Simon. International Conference on Ontologies Databases and Applications of Semantics (ODBASE), invited talk, 2006.

In this invited talk, we present the SomeWhere approach and infrastructure for building semantic peer-to-peer data management systems based on simple personalized ontologies distributed at a large scale. Somewhere is based on a simple class-based data model in which the data is a set of resource identifiers (e.g., URIs), the schemas are (simple) definitions of classes possibly constrained by inclusion, disjunction or equivalence statements, and mappings are inclusion, disjunction or equivalence statements between classes of different peer ontologies. In this setting, query answering over peers can be done by distributed query rewriting, which can be equivalently reduced to distributed consequence finding in propositional logic. It is done by using the message-passing distributed algorithm that we have implemented for consequence finding of a clause w.r.t a set of distributed propositional theories. We summarize its main properties (soundness, completeness and termination), and we report experiments showing that it already scales up to a thousand of peers. Finally, we mention ongoing work on extending the current data model to RDF(S) and on handling possible inconsistencies between the ontologies of different peers.

SomeWhere in the Semantic Web by Philippe Adjiman, Philippe Chatalic, François Goasdoué, Marie-Christine Rousset and Laurent Simon. International Workshop on Principles and Practice of Semantic Web Reasoning, Lecture Notes in Computer Science, volume 3703, pages 1-16, 2005. Also in SOFSEM'06: Theory and Practice of Computer Science (a.k.a. International Conference on Current Trends in Theory and Practice of Computer Science), as an invited talk paper (talk given by Marie-Christine Rousset).

In this paper, we describe the SomeWhere semantic peer-to-peer data management system that promotes a "small is beautiful" vision of the Semantic Web based on simple personalized ontologies (e.g., taxonomies of classes) but which are distributed at a large scale. In this vision of the Semantic Web, no user imposes to others his own ontology. Logical mappings between ontologies make possible the creation of a web of people in which personalized semantic marking up of data cohabits nicely with a collaborative exchange of data. In this view, the Web is a huge peer-to-peer data management system based on simple distributed ontologies and mappings.


Algorithms for automated ontology mapping

Une aide a la decouverte de mappings dans SomeRDFS par Francois-Elie Calvier et Chantal Reynaud. 8emes journees francophones d'Extraction et Gestion des Connaissances (EGC), 2008.

Dans cet article, nous nous interessons a la decouverte de mises en correspondance entre ontologies distribuees modelisant les connaissances de pairs du systeme de gestion de donnees P2P SomeRDFS. Plus précisement, nous montrons comment exploiter les mecanismes de raisonnement mis en oeuvre dans SomeRDFS pour aider a decouvrir des mappings entre ontologies. Ce travail est realise dans le cadre du projet MediaD en partenariat avec France Telecom.

Découverte de correspondances entre ontologies distribuées by François-Elie Calvier, Chantal Reynaud. Atelier OGHS « Ontologies et Gestion de l’Hétérogénéité Sémantique », Plate-forme AFIA 2007, Grenoble, 3 juillet 2007.

Dans cet article, nous nous intéressons à la découverte de mises en correspondance entre ontologies modélisant les connaissances des pairs d'un système pair à pair de gestion de données (PDMS). Ce travail est réalisé dans le cadre du projet MediaD au sein de la plateforme RDFS dans le contexte duquel les ontologies, les données et les mappings sont exprimés en RDF(S). Nous présentons ce contexte dans une première partie. Nous précisons ensuite les spécificités du processus de mise en correpsondance dans le cadre de PDMS par opposition au contexte centralisé. Nous montrons enfin comment le raisonnement effectué dans un PDMS peut aider à découvrir des mappings entre ontologies et découvrons quelques techniques de découverte de mappings utilisables.



Related work

A Probabilistic Trust Model for Semantic Peer to Peer Systems by Gia-Hien Nguyen, Philippe Chatalic, Marie-Christine Rousset. European Conference on Artificial Intelligence (ECAI), 2008. Also in Workshop on Data Management in Peer-to-peer systems (DAMAP'08, an EDBT'08 workshop).

Semantic peer to peer (P2P) systems are fully decentralized overlay networks of people or machines (called peers) sharing and searching varied resources (documents, videos, photos, data, services) based on their semantic annotations using ontologies. They provide a support for the emergence of open and decentralized electronic social networks, in which no central or external authority can control the reliability of the peers participating to the network. This lack of control may however cause some of the results provided by some peers to be unsatisfactory, because of inadequate or obsolete annotations. In this paper, we propose a probabilistic model to handle trust in a P2P setting. Our model supports a local computation of the trust of peers into classes of other peers. We claim that our model is well appropriate to the dynamic of P2P networks and to the freedom of each peer within the network to have different viewpoints towards the peers with whom he/she interacts.


Techniques structurelles d’alignement pour portails Web by Chantal Reynaud, Brigitte Safar. Revue RNTI, N° spécial Fouille du Web, 2007.

Le travail décrit dans cet article a pour objectif d’unifier l’accès aux documents d’un domaine d’application. Il permet en particulier d’augmenter le nombre de documents accessibles à partir de portails Web sans en modifier l’interface d’interrogation. L’accès aux documents est supposé s’appuyer sur des taxonomies que nous proposons d’aligner. Cet article porte spécifiquement sur les techniques structurelles mises en œuvre, qui sont originales et particulières dans la mesure où elles sont adaptées au traitement de taxonomies dont les structures sont hétérogènes et dissymétriques. Nous présentons et analysons ensuite les résultats de trois expérimentations effectuées sur diverses taxonomies, des taxonomies réelles qui ont motivé notre approche ainsi que des taxonomies tests mises à disposition des chercheurs de la communauté.


Utilisation de connaissances supplémentaires pour la découverte de mappings dans le système TaxoMap by Chantal Reynaud, Brigitte Safar. Atelier DECOR, EGC’2007, Namur, Belgique, 2007.

Dans ce papier, nous traitons de l'utilisation de connaissances supplémentaires pour pallier l'insuffisance de connaissances contenues dans des modèles alignés. Nous présentons la technique STRw de TaxoMap basée sur l'exploitation de la structure de WordNet. Nous effectuons une analyse comparative de cette technique par rapport à l'état de l'art, en particulier par rapport aux travaux récemment réalisés par Sabou et al (2006) et Aleksovski et al. (2006a, 2006b).


Alignement de taxonomies pour l’interrogation de sources d’information hétérogènes by Hassen Kefi, Brigitte Safar, Chantal Reynaud C. 15ème congrès francophone Reconnaissance des Formes et Intelligence Artificielle RFIA2006, Tours, 25-27 janvier, 2006.

Intégrer des sources d’information hétérogènes permet un accès unifié sans modification du contenu. Les schémas des sources sont mis en correspondance de façon à ce qu’il soit possible d’accéder à tout un ensemble de documents provenant de sources multiples, à partir d’un système d’interrogation unique. La spécification de ces mises en correspondance, ou mappings, est ainsi au cœur de l’intégration. Nous proposons d’utiliser différentes techniques d’alignement de taxonomies pour automatiser leur génération. Ces techniques ont été implémentées dans un outil logiciel TaxoMap qui recherche les mappings et, en cas d’échec, donne des indications pour aider les utilisateurs à les spécifier eux-mêmes. Nous présentons et discutons des résultats issus d’expériences réalisées dans le domaine de la microbiologie. Nous testons TaxoMap sur différentes taxonomies issues de domaines variés.


Structural techniques for Alignment of Structurally Dissymetric Taxonomies by Chantal Reynaud, Brigitte Safar, Hassen Kefi, Poster, EKAW 2006.


When Usual Structural Alignment Techniques don’t apply by Chantal Reynaud, Brigitte Safar. Poster paper, ISWC’06 Workshop on Ontology Matching (OM-06), Athens, USA, 5-9 Nov, 2006.

This paper deals with taxonomy alignment. It presents structural techniques of an alignment method suitable with a dissymmetry in the structure of the mapped ontology. The aim is to allow a uniform access to documents belonging to a same application domain, assuming retrieval of documents is supported by taxonomies.


Intégration d'Information par Médiation by François Goasdoué et Marie-Christine Rousset. Plein Sud Spécial Recherche, Université Paris-Sud XI, 2004.

L'intégration d'information est une discipline récente et incontournable de l'informatique. Elle a pour but de faciliter aux utilisateurs de moyens informatiques l'accès aux informations disséminées sur les réseaux (Internet, intranets,...). Les applications d'intégration d'informations les plus connues du grand public sont certainement les moteurs de recherche (Google, Voila, Yahoo,...). Une méthode d'intégration nommée médiation permet d'aller au-delà des services rendus par ces moteurs en concevant par exemple des portails de commerce électronique capables d'intégrer les données de plusieurs fournisseurs de contenu (Kelkoo,...). C'est cette méthode que nous abordons ici en présentant les travaux menés sur ce sujet dans l'équipe Intelligence Artificielle et Systèmes d'Inférence du Laboratoire de Recherche en Informatique de l'Université Paris Sud XI.


Querying Distributed Data through Distributed Ontologies: a Simple but Scalable Approach by François Goasdoué and Marie-Christine Rousset. IEEE Intelligent Systems, Volume 18, Issue 5, pages 60-65, 2003. Also in the international workshop Information Integration on the Web (IIWeb'03) of the Internation Joint Conference on Artificial Intelligence (IJCAI'03).

In this paper, we define a simple but scalable framework for peer-to-peer data sharing systems, in which the problem of answering queries over a network of semantically related peers is always decidable. Our approach is characterized by a simple class-based language for defining peer schemas as hierarchies of atomic classes, and mappings as inclusions of logical combinations of atomic classes. We provide an anytime and incremental method for computing all the certain answers to a query posed to a given peer such that the answers are ordered from the ones involving peers close to the queried peer to the ones involving more distant peers.