Stages 2008/09 LIP/INRIA: Grilles de PC et Calcul Haute Performance à Large Echelle

Le projet LIP/INRIA GRAAL propose des stages de Master Recherche et Ecole d'Ingénieur pour 2007-2008 pouvant durer de 4 à 6 mois.

Sur cette page vous trouverez une liste de stages proposés dans le domaine des grilles à large échelle de ressources volatiles (Desktop Grid). Les sujets abordent plusieurs thèmes de recherche tels que les problèmatique de placement/ordonnancement, de communications, de distribution efficace des données grâce aux protocoles pair-à-pair. D'autres sujets sont plutôt Ces stages ont pour support les plate-forme de Desktop Grid développée à l'INRIA XtremWeb (http://www.XtremWeb.net) et BitDew (http://www.bitdew.net), la grille expérimentale Grid5000 (> 2500 CPU répartis sur 8 clusters) et sur la plate-forme expérimentale DSLLab (http://dsllab.org).

Stratégies de placement efficace de données sur les grilles d'ordinateurs personnels

Encadrement : Gilles Fedak, Haiwu He

Les systèmes de grilles de PC permettent de valoriser l'infrastructure informatique existante (PC et réseau) d'une entreprise, d'une université ou d'une communauté virtuelle sur Internet; en permettant d'obtenir à moindre frais de grandes capacités de calcul et de stockage. Ces systèmes ont démontré qu'ils pouvaient fournir une gigantesque puissance de calcul (par exemple plus de 450 TeraFlops pour SETI@Home) à partir de centaines de milliers de d'ordinateurs domestiques prétés par des utilisateurs volontaires. Néanmoins, les capacités de stockage de ces systèmes sont peu exploitées alors qu'elles pourraient bénéficier aux classes d'applications parallèles de traitements de grandes données ! Ces applications concernent différents domaines scientifiques (bio-informatique, physique, traitement d'images etc...), et sont de première importance pour la communauté scientifique

Le sujet de stage que nous proposons consiste à élaborer des stratégies de placement des données sur les ordinateurs personnels. La difficulté provient de la grande taille de ces systèmes. En effet, pour distribuer efficacement des données sur un grand nombre d'ordinateurs personnels, il est nécessaire d'utiliser des approches Peer-to-Peer telles que, par exemple, le protocole Bittorrent. Par ailleur, puisque tous les noeuds du réseau sont impliqués dans la distribution des fichiers, il est plus difficile de prévoir les temps de transferts de fichiers. Par conséquent, il faut adapter ou revoir les heuristiques classiques de placement/ordonnancement. D'autre part, les noeuds sont volatiles car ils peuvent joindre et quitter le réseau à tout moment. Il faut donc aussi prendre en compte la probabilité qu'une donnée soit présente en fonction de la disponibilité de ce noeud.

Le stage se composera des étapes suivantes :

Mots clés : Desktop GRID, Data GRID

Profil: Stage de recherche théorique et expérimental

Matériel utilisé: l'étudiant aura accès  à DSLLab (40   noeuds répartis sur Internet) et à la grille  Grid5000 (>2500 CPU répartis sur toute la France)

Backbone P2P : partage de fichier efficace avec BitDew

Encadrement : Gilles Fedak

Les systèmes actuels d'échange de fichiers souffrent de plusieurs limitations : d'une part les systèmes sont moins efficaces en terme de disponibilité des données et de performance de téléchargement pour les données rares ou faiblement partagées, d'autre part, ces systèmes n'offrent pas à leurs utilisateurs de garanties d'anonymat suffisantes. L'idée de backbone P2P est de fournir un logiciel P2P d'échange de fichier qui utilise une infrastructure client/seveur de stockage existente (megaupload, gmail, Amazon S3, serveurs ftp etc...) pour fournir une meilleur qualité de service ainsi qu'une plus grande sécurité aux utilisateurs.

Ce sujet de stage s'appuie l'environnement de gestion des données à grande échelle BitDew (http://www.bitdew.net). BitDew est un environnement d'exécution programmable qui peut être intégré dans les systèmes de Grid ou de Desktop Grid et qui implémente la distribution et l'indexation de façon centralisées ou distribuées (pair-à-pair). Le principe est le suivant : l'utilisateur définit pour chacune des données des attributs (placement, affinité, ordonnancement, réplication, tolérance aux pannes, distribution, cycle de vie), que l'environnement va interpréter dynamiquement de façon transparente. L'utilisateur n'a donc pas à prendre en charge la tolérance aux pannes et la localisation des données, ce qui est primordial dans les grands systèmes distribués composés de ressources volatiles.

Le sujet consistera à concevoir un logiciel de partage de fichiers qui garantisse l'anonymat des utilisateurs et la persistence des fichiers en utilisant BitDew et à réaliser son implémentation en Java. Ce stage comporte un volet développement important et l'étudiant devra être familier du langage Java. La connaissance des systèmes distribués, des systèmes P2P, de la cryptographie serait un plus appréciable.

Mots clés :P2P, BitDew

Profil: Stage d'ingénieur ou de master

Matériel utilisé: l'étudiant aura accès  à DSLLab (40   noeuds répartis sur Internet) et à la grille  Grid5000 (>2500 CPU répartis sur toute la France)


Gilles Fedak
Last modified: 15/10/2007