In Situ : stages

Comparaison des méthodes d'ordonnancement de matrices (sujet proposé par Jean-Daniel Fekete)

Les tables de données sont maintenant très populaires, grace aux tableurs en particulier, mais aussi aux bases de données. Cependant, comprendre et explorer une grande table reste long et difficile. La visualisation d'information permet de simplifier ces processus et de faire apparaître la ou les structures des données de manière spontanée.

Les mêmes techniques peuvent être appliquées à des tables et à des graphes. La visualisation de graphes peut se faire à l'aide de deux représentations : les diagrammes nœud-lien ou les matrices d'adjacence. La première représentation est populaire et bien comprise mais pose des problèmes lorsque le graphe devient gros ou dense. Depuis quelques années, les matrices d'adjacence ont acquis une certaine popularité en visualisation d'information car elles permettent de mener à bien des tâches quelque soit la taille ou la densité des graphes qu'elles représentent (navigation, questions de détails, questions sur les adjacences etc.) Cependant, pour que la structure d'une matrice d'adjacence ou d'un tableau de valeur soit compréhensible, il faut que cette matrice soir correctement ordonnée. Il est toujours possible de permuter deux lignes ou deux colonnes d'une matrice sans en changer le sens. Bertin a montré dans les années 60 qu'un bon ordonnancement de matrice permettait de faire apparaître une structure globale et décuplait l'utilité de la représentation matricielle. Depuis les années 60, plusieurs méthodes de réordonnancement de matrice ont été proposées dans la littérature, mais elles n'ont jamais été comparées ou convenablement évaluées en terme de complexité algorithmique ou de lisibilité.

L'objet de ce stage est d'avancer dans cette comparaison systématique. Il s'agira donc de sélectionner des méthodes d'ordonnancement, de les implémenter ou des les récupérer sur le Web, et de les comparer en fonctions de critères algorithmiques et cognitifs. Cette étude s'inscrit à l'intersection de plusieurs projets qui utilisent notre boîte à outils de visualisation d'information dans des domaines aussi variés que les réseaux sociaux, la bioinformatique et le data-mining. Un tel travail bien mené aboutira à une publication internationale.

Visualisation matricielle des notes des étudiants de Master Recherche, avant et après ordonnancement :