Bioinformatik für Infektionskrankheiten bei Neugeborenen setzt auf Clouds
Neugeborene Babys, vor allem Frühgeburten und Kinder mit niedrigem Geburtsgewicht, können mit schädlichen Krankheitserregern infiziert werden, was in fast 30 % der Todesfälle bei Neugeborenen weltweit der Fall ist. Mit Laborkulturtechniken können nicht alle Bakterienstämme ermittelt werden und sie geben auch keine wertvollen Details über die Immunantwort preis. Einen Schutz vor dieser Gefahr für die Gesundheit wollte das Projekt CLOUDX-I (Cloud based software solution for next generation diagnostics in infectious diseases) finden. Wie Professor Roy Sleator, Koordinator des Projekts, erklärt, „konzentrierte sich das Projekt CLOUDX-I auf die Entwicklung neuer rechnergestützter Verfahren zur Unterstützung von Diagnose und Prognose im Zusammenhang mit Neugeboreneninfektionen. Traditionellen Laborkulturtechniken mangelt es oft an Spezifität und Empfindlichkeit, so dass häufig falsche diagnostische Ergebnisse die Folge sind. Zudem beziehen sie nicht die resultierende Wirtsantwort mit ein und geben nur wenige prognostische Daten preis.“ Biomarker mit Relevanz für bakterielle Infektionen entdeckt Das Projekt wählte zehn Schlüsselbakterien für eine DNA-Sequenzierung unter Einsatz der Einzelnukleotidpaar-Analyse (Single Nucleotide Pair, SNP) aus. Zu den Spezies zählten Enterococcus faecalis, ein opportunistischer Erreger, und Staphylococcus aureus (S. aureus), der für seine zunehmende Resistenz gegen Antibiotika berüchtigt ist. Beide Bakterien können bei Neugeborenen Sepsis verursachen. Die Forscher konnten nun robuste Biomarker identifizieren, die für die zentralen neonatalen Pathogene spezifisch sind. Noch wichtiger ist, dass diese spezifische genetische Loci mit signifikanten physiologischen Merkmalen und Mechanismen dieser Krankheitserreger einschließlich Biofilmbildung und Antibiotikaresistenz verknüpfen. Cloud-Computing mit Höchstgeschwindigkeit CLOUDX-I ist die Analyse von Big Data aus den Sequenzierungsergebnissen durch Implementierung des Cloud-gestützten Hadoop angegangen. Zudem wurde die Geschwindigkeit der Analyse von S. aureus um das Zehnfache beschleunigt. Computer-Cluster wurden außerdem derart technisch bearbeitet, dass sie die Sequenzeinheiten gleichzeitig laufen lassen. Zwecks verbesserter Effizienz bei Speicherung und Verarbeitung entwickelten die Forscher eine neuartige parallele Version von CloudBlast, einer Community-Ressource für massive Sequenzalignmentaufgaben. „Sie kann auf gängiger Hardware mit sehr moderatem Speicherbedarf laufen und funktioniert gut mit den größten Datenbanken wie etwa NCBI NR/NT und Uniprot“, erläutert Professor Sleator. NCBI ist eine Sammlung von Sequenzen aus verschiedenen Quellen, darunter GenBank und die Protein Data Bank, während UniProt eine Ressource für die mit der Funktion verknüpfte Proteinsequenz ist. Gute Nachrichten weltweit verkünden Forschungsstipendiaten aus der Molekulardiagnostik sowie dem Cloud-Computing erhielten sechs spezielle Wissenstransfer-Workshops (‘transfer of knowledge’). Außerdem wurden rund um CLOUDX-I zwei internationale Forschungskonferenzen organisiert, an denen alle Partner teilnahmen. Insgesamt wurden fünfzig international von Experten begutachtete Publikationen sowie Presseartikel erstellt, sechs internationale Konferenzen und Fachmessen sowie drei Outreach-Veranstaltungen mit Bildungsinhalt realisiert. Nennenswert sind zwei wissenschaftliche Arbeiten mit besonderer Relevanz auf dem Gebiet, die den Erfolg bekunden. Die erste, „Big data, Hadoop and cloud computing in genomics“, wurde im Journal of Biomedical Informatics veröffentlicht und war der in einem Zeitraum von drei Monaten am viertmeisten aus der Zeitschrift heruntergeladene Artikel. Zweitens und paradoxerweise aufgrund der begrenzten Stichprobengröße infolge ethischer Beschränkungen untersuchte das Team in Zusammenarbeit mit dem Partnerunternehmen nSilico und zwei weiteren Labors die Realisierbarkeit der Anwendung eines Mausmodells anstelle eines neonatalen menschlichen Systems für die Wirtsreaktion auf bakterielle Pathogene. Die Arbeit mit dem Titel „Recapitulation of human neonatal immune signatures in newborn infected mice“ (Rekapitulation von menschlichen neonatalen Immunsignaturen bei neugeborenen infizierten Mäusen) wird derzeit geprüft. Professor Sleator fasst die Einflussnahme des CLOUDX-I Projektes wie folgt zusammen: „Neben der Entwicklung einer robusten, nutzerfreundlichen, auf Cloud-Computing basierenden Informationsverarbeitungsplattform zur effektiveren und schnelleren Diagnose und Prognose von Neugeboreneninfektionen ist es dem Projekt gelungen, Biologen in Informatik zu schulen und Informatikern tiefergehendes Wissen über klinische Probleme zu vermitteln. Diese Schulung hat eine Gruppe von jungen Wissenschaftlern mit einer einzigartigen Kombination von Fähigkeiten hervorgebracht, die wahrscheinlich zu weiteren klinisch wichtigen Softwarepaketen wie etwa Simplicity beitragen werden – womit das Potenzial auf die Rettung von Leben einhergeht.“
Schlüsselbegriffe
Neugeborene, Infektionskrankheit, Cloud, Daten, Analyse, CLOUDX-I