Sujet de thèse 2009 LIP/INRIA: Traitement intensif de données sur les grilles d'ordinateurs personnels.

Les systèmes de grilles de PC permettent de valoriser l'infrastructure informatique existante (PC et réseau) d'une entreprise, d'une université ou d'une communauté virtuelle sur Internet; en permettant d'obtenir à moindre frais de grandes capacités de calcul et de stockage. Ces systèmes ont démontré qu'ils pouvaient fournir une gigantesque puissance de calcul (par exemple plus de 450 TeraFlops pour SETI@Home) à partir de centaines de milliers de d'ordinateurs domestiques prétés par des utilisateurs volontaires. Néanmoins, les capacités de stockage de ces systèmes sont peu exploitées alors qu'elles pourraient bénéficier aux classes d'applications parallèles de traitements de grandes données ! Ces applications concernent différents domaines scientifiques (bio-informatique, physique, traitement d'images etc...), et sont de première importance pour la communauté scientifique et ont de nombreuses applications dans l'industrie.

Cette thèse s'appuie l'environnement de gestion des données à grande échelle BitDew (http://www.bitdew.net). BitDew est un environnement d'exécution programmable qui peut être intégré dans les systèmes de Grid ou de Desktop Grid et qui implémente la distribution et l'indexation de façon centralisées ou distribuées (pair-à-pair). Le principe est le suivant : l'utilisateur définit pour chacune des données des attributs (placement, affinité, ordonnancement, réplication, tolérance aux pannes, distribution, cycle de vie), que l'environnement va interpréter dynamiquement de façon transparente. L'utilisateur n'a donc pas à prendre en charge la tolérance aux pannes et la localisation des données, ce qui est primordial dans les grands systèmes distribués composés de ressources volatiles.

Le sujet de thèse que nous proposons consiste en l'étude d'un certain nombre de points permettant le traitement intensif de données sur les grilles de PC :