Français Anglais
Accueil Annuaire Plan du site
Accueil > Production scientifique > Thèses et habilitations
Production scientifique
Doctorat de

Doctorat
Equipe : Bases de Données

Analyse statique pour l’optimisation des mises à jour de documents XML temporels

Début le 01/09/2008
Direction : BIDOIT, Nicole

Ecole doctorale :
Etablissement d'inscription : Université Paris-Sud

Lieu de déroulement : LRI BD

Soutenue le 07/09/2012 devant le jury composé de :
Nicole Bidoit-Tollu Professeur, Université Paris Sud Directeur de thèse
Bogdan Cautis MdC HdR, Télécom ParisTech Examinateur
Dario Colazzo MdC HdR, Université Paris Sud Directeur de thèse
Stéphane Gançarski MdC HdR, Université Pierre et Marie Curie Rapporteur
Mírian Halfeld Ferrari Alves Professeur, Université d’Orléans Rapporteur
Sophie Laplante Professeur, Université Paris Sud Examinateur

Activités de recherche :

Résumé :
Ces dernières années ont été marquées par l’adoption en masse de XML comme format d’échange et de représentation des données sur le web. Cette évolution s’est accompagnée du développement de langages pour l’interrogation et la manipulation des données XML. En parallèle, une large panoplie de systèmes ont été mis en œuvre pour permettre le stockage et le traitement des données XML. Parmi ces systèmes, les moteurs mémoire centrale sont particulièrement prisés par les applications qui ne requièrent pas de fonctionnalités avancées des SGBD traditionnels telles que les index ou la gestion des transactions. Ces moteurs nécessitent de charger les documents devant être traités entièrement en mémoire centrale et sont donc limités quant à la taille des documents pouvant être manipulés.

L’objectif de cette thèse est d’étudier et de proposer des techniques permettant le traitement efficace des documents XML sous des contraintes de mémoire centrale en se focalisant sur les aspects liés à l’évolution des données XML (càd les mises à jour) et à la gestion de la dimension temporelle de celles-ci.

Les contributions de cette thèse se dévoilent en deux parties. La première partie se focalise sur l’optimisation des mises à jour des documents XML. Pour cette partie, nous proposons une technique basée sur la projection XML, méthode préalablement utilisée pour l’optimisation des requêtes XML. L’utilisation de la projection pour le cas des mises à jour n’est pas triviale car elle soulève de nouveaux problèmes liés, en partie, à la propagation des effets des mises à jours. La technique que nous mettons au point permet d’obtenir un gain significatif en terme de réduction de l’espace nécessaire pour le traitement des documents mais aussi en terme de temps nécessaire pour l’exécution des mises à jour.

La deuxième partie est consacrée à l’étude de techniques permettant la construction et la maintenance de documents XML estampillés en considérant, comme précédemment, la contrainte d’espace. A cette contrainte s’ajoute la nécessité de générer des documents estampillés qui soient efficaces du point de vue du stockage. Nous proposons deux méthodes. La première s’applique dans le cas général et ne fait aucune hypothèse sur l’évolution des documents XML, celle-ci pouvant consister en une mise à jour ou en une simple édition. Etant confrontée à la limitation en terme de mémoire centrale, cette méthode est conçue de sorte à manipuler les documents estampillés en streaming. Ceci lui permet effectivement de traiter des documents volumineux mais l’empêche de générer les documents les plus compacts. La deuxième méthode s’applique dans le cas où les changements sont spécifiés par des mises à jour. Elle utilise le paradigme de projection développé pour l’optimisation des mises à jour. L’utilisation de la projection lui permet en outre de manipuler des documents volumineux de générer des documents estampillés satisfaisant du point de vue du stockage.