Français Anglais
Accueil Annuaire Plan du site
Accueil > Production scientifique > Thèses et habilitations
Production scientifique
Doctorat de

Doctorat
Equipe : Bases de Données

Optimisation de requêtes olap et visualisation de résultats

Début le 15/09/2007
Direction : SPYRATOS, Nicolas

Ecole doctorale : Paris XI
Etablissement d'inscription : Université Paris-Sud

Lieu de déroulement : LRI

Soutenue le 16/09/2011 devant le jury composé de :
* Mohand-Said HACID Professeur, Université Claude-Bernard Lyon 1
Rapporteur
* Dominique LAURENT Professeur, Université de Cergy-Pontoise
Rapporteur
* Michel De ROUGEMONT Professeur, Université Paris 2,
Examinateur
* François GOASDOUÉ Maitre de conférences, Université Paris-Sud 11
Examinateur
* Nicolas SPYRATOS Professeur, Université Paris-Sud 11
Directeur

Activités de recherche :
   - Bases de données
   - Bases de données multidimensionnelles

Résumé :
Nous explorons différents aspects des entrepôts de données et d’OLAP, le
point commun de nos recherches étant le modèle fonctionnel pour l'analyse
de données. Notre objectif principal est d'utiliser ce modèle dans l'étude
de trois aspects différents, mais liés:

- l'optimisation de requêtes par réécriture et la gestion du
cache,
- la visualisation du résultat d'une requête OLAP,
- le mapping d'un schéma relationnel en BCNF vers un schéma
fonctionnel.

L'optimisation de requêtes et la gestion de cache sont des problèmes
cruciaux dans l'évaluation de requêtes en général, et les entrepôts de
données en particulier; et la réécriture de requêtes est une des techniques
de base pour l'optimisation de requêtes. Nous établissons des conditions
d'implication de requêtes analytiques, en utilisant le pré-ordre partiel
sur l'ensemble de requêtes, et nous définissons un algorithme sain et
complet de réécriture ainsi que une stratégie de gestion de cache
optimisée, tous les deux basés sur le modèle fonctionnel.
Le deuxième aspect important que nous explorons dans cette thèse est celui
de la visualisation du résultat. Nous démontrons l'importance pour la
visualisation de reproduire des propriétés essentielles de données qui sont
les dépendances fonctionnelles. Nous montrons que la connexion, existante
entre les données et leur visualisation, est précisément la connexion entre
leurs représentations fonctionnelles. Nous dérivons alors un cadre
technique, ayant pour objectif d'établir une telle connexion pour un
ensemble de données et un ensemble de visualisations.
En plus d'analyse du processus de visualisation, nous utilisons le modèle
fonctionnel comme un guide pour la visualisation interactive, et
définissons ce qu'on appelle la visualisation paramétrique.
Le troisième aspect important de notre travail est l'expérimentation des
résultats obtenus dans cette thèse. Les résultats de cette thèse peuvent
être utilisés afin d’analyser les données contenues dans une table en
Boyce-Codd Normal Form (BCNF), étant donné que le schéma de la table peut
être transformé aisément en un schéma fonctionnel. Nous présentons une
telle transformation (mapping) dans cette thèse. Une fois le schéma
relationnel transformé en un schéma fonctionnel, nous pouvons profiter des
résultats sur l'optimisation et la visualisation de requêtes. Nous avons
utilisé cette transformation dans l’implémentation de deux prototypes dans
le cadre de deux projets différents.