La bioinformatique pour lutter contre les maladies infectieuses des nouveau-nés
Les nouveau-nés, en particulier les prématurés et ceux présentant un faible poids à la naissance, risquent d'être infectés par des pathogènes dangereux, qui entraînent près de 30 % des décès néonatals dans le monde. Les techniques de culture en laboratoire n'identifient pas toutes les souches bactériennes et ne fournissent pas d'informations importantes sur la réponse immunitaire. Le projet CLOUDX-I (Cloud based software solution for next generation diagnostics in infectious diseases) a cherché à apporter une réponse à ce problème de santé. Comme le fait remarquer le professeur Roy Sleator, coordinateur du projet, «Le projet CLOUDX-I s'est efforcé de développer de nouvelles techniques informatiques pour faciliter le diagnostic et le pronostic des infections néonatales. Les techniques traditionnelles de culture en laboratoire humide manquent souvent de précision et de sensibilité, ce qui entraîne souvent des résultats diagnostiques erronés. Par ailleurs, elles n'intègrent pas la réponse de l'hôte, ce qui limite les données de pronostic.» Découverte de biomarqueurs détectant des infections bactériennes Le projet a sélectionné dix bactéries clés pour un séquençage ADN utilisant une analyse de polymorphisme mononucléotidique (SNP pour single nucleotide polymorphism). Ces espèces comprenaient Enterococcus faecalis, un pathogène opportuniste et Staphylococcus aureus (S. aureus), célèbre pour sa résistance croissante aux antibiotiques. Ces deux bactéries provoquent des infections chez les nouveau-nés. Les chercheurs ont identifié des biomarqueurs fiables spécifiques aux principaux pathogènes néonatals. Fait important, ils établissent un lien entre des loci génétiques précis et d'importants mécanismes et caractéristiques physiologiques de ces pathogènes, tels que la production de biofilm et la résistance aux antibiotiques. L'informatique en nuage à pleine vitesse CLOUDX-I a analysé l'énorme quantité de données résultant du séquençage en utilisant Hadoop, une solution basée sur le cloud. La vitesse d'analyse de S. aureus a en outre été multipliée par dix. Le projet a constitué des grappes d'ordinateurs pour effectuer de façon simultanée des assemblages de séquences. Pour une plus grande efficacité de traitement et d'utilisation de la mémoire, les chercheurs ont développé une nouvelle version parallèle de CloudBlast, une ressource communautaire destinée aux tâches massives d'alignement de séquences. «Peu exigeante en termes de mémoire, notre solution peut tourner sur du matériel de base et fonctionne bien avec les plus grandes bases de données, comme NCBI NR/NT et Uniprot», souligne le professeur Sleator. NCBI est une collection de séquences issue de plusieurs sources dont GenBank et la Protein Data Bank, alors qu'UniProt est une ressource pour les séquences de protéines liées à une fonction. Diffuser l'information partout dans le monde Six ateliers spécialisés de «transfert de connaissances» ont été organisés au bénéfice de chercheurs associés, spécialisés aussi bien en diagnostic moléculaire qu'en cloud computing. Deux conférences de recherche internationales ont également été organisées autour de CLOUDX-I, auxquelles ont participé tous les partenaires. Au total, le projet a produit cinquante publications dans des revues à comité de lecture ainsi que des articles de presse, six conférences et salons professionnels internationaux et trois évènements éducatifs de sensibilisation. Deux articles en particulier ont rencontré un grand succès. Le premier, 'Big data, Hadoop and cloud computing in genomics', qui a été publié dans le Journal of Biomedical Informatics, a été le quatrième article le plus téléchargé de la revue sur une période de trois mois. Le deuxième a été motivé par la taille limitée de l'échantillon, due à des restrictions éthiques. L'équipe et la société partenaire nSilico ont étudié la possibilité d'utiliser un modèle murin plutôt qu'un système néonatal humain pour étudier la réponse de l'hôte aux bactéries pathogènes. Ce travail, intitulé «Recapitulation of human neonatal immune signatures in newborn infected mice», est en cours d'examen. Le professeur Sleator résume l'impact du projet CLOUDX-I. «Non seulement la projet a développé une plateforme informatique puissante, conviviale et basée sur le cloud pour un diagnostic et un pronostic plus efficaces et rapides des infections néonatales, mais il a également permis de donner une formation informatique à des biologistes et d'apporter à des spécialistes en informatique une meilleure connaissance des problèmes cliniques. Cette formation a permis de constituer un groupe de jeunes scientifiques dotés de compétences uniques, qui contribueront probablement à d'autres logiciels importants sur le plan clinique, dans le but de sauver des vies.»
Mots‑clés
Nouveau-né, maladie infectieuse, cloud, données, analyse, CLOUDX-I