DSTIC - RTP 9
Bases de données et d'informations hétérogènes et distribuées
Action Spécifique
Langages, Types, Sécurité et Intégrité pour données semi-structurées.

Thématiques

L'explosion récente d'Internet comme support de calculs globaux conduit à l'échange croissant d'informations. La nature hautement distribuée du réseau induit que les informations sont généralement collectées, traitées puis restructurées à partir de sources multiples et hétérogenes. Afin d'en permettre le traitement ces informations sont publiées sous un meme format. XML devient le standard de-facto pour l'échange et la manipulation de documents sur le Web. De nombreux facteurs plaident en faveur de son acceptation : le fait que les documents XML soient lisibles par un humain ainsi que leur nature auto-descriptive ; le processus actif de standardisation du W3C et le fait que de nombreuses entreprises, parmi les plus representatives dans le domaine des technologies de l'information, l'aient dores et déjà adopté. Cependant, le phénomene XML s'accompagne au moins de trois paradoxes :
  1. Bien qu'XML soit en passe de devenir le standard de-facto d'échanges et de manipulation d'informations au sein du middleware, peu d'attention a été portée sur la nature même de tels échanges. En particulier, les aspects de sécurité liés à la caractérisation et l'analyse des flots d'informations ne sont pas pris en compte dans ce cadre.
  2. De même, des aspects liés à l'intégrité des documents sont peu exploités. A nouveau, une telle situation est surprenante si l'on considère XML comme un standard de représentation d'informations sur Internet. Etre en mesure de précisement représenter l'information, d'en extraire des proprietés pertinentes et d'en assurer la manipulation de facon fiable constitue une première étape pour garantir la qualité des services du web.
  3. Comme le reflete le processus actuel de standardisation, les documents XML sont intrinsequement types (notions de validité et de bonne formation relativement à une DTD, X-Schema, Relax-NG). Or, les langages de transformation associés (Xpath/XSLT) sont essentiellement non-typés.
Ces trois aspects sont intimement liés.
  1. En matière de sécurité (orientée langage) par exemple, l'exploitation tant statique que dynamique d'un systeme de types sous-jacent constitue un premier outil pour analyser les flots d'information masqués par une transformation.
  2. Dans une donnée semi-structurée (un document XML par exemple) il existe des relations entre les données du document. Ainsi, dans le cadre d'une application de vente par correspondance, une contrainte attendue est qu' une commande soit passée par un client . Ces liens ne sont pas necessairement reveles par la DTD. On les exprime sous la forme de contraintes de chemin, qui permettent de définir à la fois des types traditionnels et des contraintes d'intégrité. Ainsi, typage, sécurité (orientée langage) et intégrité sont trois aspects étroitement correlés.

Texte de la proposition


Partenaires

Réunions

  1. Programme 14 novembre 2003