Une meilleure gestion des ressources pour le traitement des informations métagénomiques
Les problèmes qui se présentent dans le domaine de la bioinformatique sont souvent associés à des processus informatiques compliqués, très consommateurs de temps machine et de ressources. Les chercheurs estiment qu'un grand nombre de ces difficultés opérationnelles peuvent être résolues en utilisant une grille informatique, c'est-à-dire un réseau d'ordinateurs se trouvant sur des sites divers. Le champ de la bioinformatique appelé métagénomique consiste à étudier le génome d'une communauté de microbes. Les problèmes qui se posent portent sur l'annotation (l'identification des caractéristiques clés) de ces génomes ainsi que sur leur assemblage dans des environnements variés. L'annotation donne un sens biologique à des ensembles d'informations brutes. Le projet Metagenogrids («Algorithmics for metagenomics on grids») visait à trouver des solutions algorithmiques aux problèmes de métagénomique, qui seraient exécutées sur des plates-formes informatiques à grille. Cependant, les chercheurs ont décidé de recentrer l'objet de leur études après avoir constaté leurs efforts infructueux afin de mettre en œuvre une collaboration solide pour l'étude de l'assemblage métagénomique. Le nouvel objectif a été de définir une planification par lots plus efficace pour améliorer l'allocation et la gestion des ressources entre clusters informatiques. Un autre défi consistait à garantir la qualité de service offerte aux utilisateurs de ces plates-formes. L'équipe Metagenogrids financée par l'UE a commencé par étudier la question de l'allocation de ressources aux applications avec des taux de consommation de ressources réguliers et dont les temps d'exécution sont infinis ou inconnus. Plusieurs algorithmes de planification de tâches ont été développés et les résultats ont été présentés pour des charges de travail en calcul de haute performance. Comparés avec les algorithmes de planification par lots standard, les résultats obtenus avec les nouveaux algorithmes proposés était largement meilleurs en termes de performances dans une grande majorité des scénarios étudiés. Cela a constitué une avancée quant à la possibilité de combiner la technologie de virtualisation avec des stratégies de planification légère. Les résultats du projet ont fait avancer les travaux qui permettent d'envisager la conception future de systèmes de gestion des ressources pour une meilleure utilisation des plates-formes, aboutissant à une amélioration des résultats et de la qualité de service. Les fondations posées par cette étude semblent assez solides pour servir de support à l'étude ultérieure qui vise à étendre les résultats aux applications dont les taux de consommation de ressources varient pendant l'exécution de l'application.