La bioinformatica per le malattie infettive neonatali raggiunge le nuvole
I neonati – soprattutto quelli prematuri e con basso peso alla nascita – possono essere infettati da patogeni nocivi che sono responsabili di quasi il 30 % dei decessi neonatali a livello globale. Le tecniche di laboratorio biomedico non sono in grado di individuare i ceppi batterici e non forniscono dati utili sulla risposta immunitaria. Il progetto CLOUDX-I (Cloud based software solution for next generation diagnostics in infectious diseases) ha cercato di offrire una soluzione per questa emergenza sanitaria. Come spiega il prof. Roy Sleator, coordinatore del progetto, “Il progetto CLOUDX-I si è concentrato sullo sviluppo di nuove tecniche computazionali per sostenere la diagnosi e la prognosi delle infezioni neonatali. Le tradizionali tecniche di coltura in laboratorio umido spesso non sono abbastanza specifiche e sensibili, producendo spesso risultati diagnostici inesatti. Inoltre, non includono la relativa risposta dell’ospite, fornendo scarsi dati prognostici.” Scoperti biomarcatori utili per rilevare le infezioni batteriche Il progetto ha selezionato dieci importanti batteri per il sequenziamento del DNA utilizzando l’analisi dei polimorfismi a singolo nucleotide (single nucleotide polymorphism, SNP), tra i quali l’Enterococcus faecalis, un patogeno opportunistico, e lo Staphylococcus aureus (S. aureus), noto per la sua crescente resistenza agli antibiotici. Entrambi i batteri possono causare sepsi nei neonati. I ricercatori hanno identificato biomarcatori specifici per i principali patogeni neonatali. Da notare che questi collegano loci genetici specifici a importanti funzionalità e meccanismi fisiologici di tali patogeni, tra cui la produzione di biofilm e la resistenza agli antibiotici. Il cloud computing alla massima velocità CLOUDX-I ha usato l’Hadoop basato sul cloud per l’analisi dei megadati prodotti dal sequenziamento. Inoltre, è stata aumentata di dieci volte la velocità d’analisi dello S. aureus. Sono anche stati costruiti cluster di computer per effettuare assemblaggi di sequenze simultanei. Per migliorare l’efficienza di memoria e di calcolo, i ricercatori hanno sviluppato una nuova versione parallela di CloudBlast, una risorsa della community per svolgere allineamenti di sequenze di grande dimensioni. “Può essere usata su commodity hardware con requisiti di memoria limitati e funziona bene con i più grandi database quali NCBI NR/NT e Uniprot,” fa notare il prof. Sleator. NCBI è una raccolta di sequenze provenienti da varie risorse, tra cui GenBank e la Protein Data Bank, mentre UniProt è una risorsa per il sequenziamento delle proteine collegato alla funzione. Diffondere la notizia a livello mondiale Sono stati organizzati sei workshop specialistici per il “trasferimento di conoscenze” a borsisti di ricerca in diagnostica molecolare e cloud computing. Inoltre, si sono svolte due conferenze di ricerca internazionali relative a CLOUDX-I, alle quali hanno partecipato tutti i partner. Sono stati pubblicati oltre cinquanta articoli sottoposti a revisione paritaria, oltre ad articoli sulla stampa, sei conferenze e fiere internazionali, e tre eventi di divulgazione. Di particolare rilevanza sono due documenti che hanno ottenuto un grande successo nel loro campo. Il primo, “Big data, Hadoop and cloud computing in genomics”, è stato pubblicato sul Journal of Biomedical Informatics, risultando il quarto articolo più scaricato dalla rivista nel giro di tre mesi. In secondo luogo – e ironicamente a causa di limitazioni temporali – insieme ad altri due laboratori, il team ha studiato la possibilità di utilizzare un modello murino al posto di un sistema neonatale umano, per sudiare la risposta dell’ospite ai patogeni batterici. Il lavoro è stato presentato per la pubblicazione su Nature Medicine, con il titolo “Recapitulation of human neonatal immune signatures in newborn infected mice”, e si trova in fase di revisione. Il prof. Sleator riassume l’impatto del progetto CLOUDX-I: “Oltre a sviluppare una piattaforma basata sul cloud computing solida e facile da utilizzare, per una rapida diagnosi e prognosi delle infezioni neonatali, il progetto è riuscito a offrire ai biologi una formazione in informatica e agli informatici conoscenze più approfondite sugli aspetti clinici. Tale formazione ha prodotto una coorte di giovani scienziati con una serie di competenze singolari, che probabilmente contribuiranno ad altri pacchetti software importanti dal punto di vista clinico – i quali potrebbero salvare vite umane.”
Parole chiave
Neonato, malattia infettiva, cloud, dati, analisi, CLOUDX-I