s'authentifier
version française rss feed
HAL : tel-00462306, version 1

Fiche détaillée  Récupérer au format
Université Blaise Pascal - Clermont-Ferrand II (03/12/2008), F. Desprez, V. Breton (Dir.)
Gestion des bases de données biologiques sur grilles de calculs
G. Le Mahec1, 2
(03/12/2008)

Depuis le début des années 80, les bases de données biologiques n'ont cessé de gagner en volume. Une recherche sur ces bases qui ne prenait que quelques minutes peut désormais nécessiter plusieurs jours. En parallèle, la communauté de recherche en bioinformatique s'est développée et des laboratoires spécialisés sont nés partout dans le monde. La collaboration et l'échange de données entre équipes de recherche parfois géographiquement très éloignées a conduit à considérer la grille comme un moyen adapté à la fois aux nouveaux besoins en terme de puissance de calcul mais aussi comme outil de partage et de distribution des données biologiques entre chercheurs. L'utilisation de la grille pour la recherche en biologie et bioinformatique est un atout considérable, cependant de nouvelles problématiques apparaissent quant `a la gestion des données ainsi que dans l'ordonnancement des tâches qui doit prendre en compte la taille et la disponibilité des données. Cette thèse aborde ces problématiques nouvelles en prenant en compte les spécificités des bases de données biologiques pour une utilisation efficace de la grille. Nous montrons l'intérêt des approches semi-statiques joignant réplications de données et ordonnancement des tâches. Pour cela, nous avons procédé en trois étapes : une analyse théorique, une première validation par simulation et enfin une implantation sur plateforme réelle. La mise en place de la plateforme a mené à la conception d'un nouveau gestionnaire de données pour l'intergiciel DIET : DAGDA. Au-delà des applications de bioinformatique, ce gestionnaire de données peut répondre aux besoins de nombreuses applications portées sur les grilles de calcul
1 :  LPC-CLERMONT - Laboratoire de Physique Corpusculaire de Clermont-Ferrand
2 :  INRIA Grenoble Rhône-Alpes / LIP Laboratoire de l'Informatique du Parallélisme - COMPSYS
Informatique/Modélisation et simulation
grilles de calcul – gLite – DIET – DAGDA – bio-informatique
Liste des fichiers attachés à ce document : 
PDF
LeMahec.pdf(7 MB)