Análisis bioinformáticos en la nube para enfermedades infecciosas en recién nacidos
Los recién nacidos, especialmente los prematuros y con bajo peso al nacer, pueden infectarse con patógenos peligrosos, fenómeno responsable de aproximadamente un 30 % de todas las muertes neonatales en el mundo. Las técnicas de cultivo microbiológico tradicionales no permiten identificar todas las cepas bacterianas y, además, no proporcionan información útil sobre la respuesta inmunitaria. La respuesta a esta amenaza para la salud ha sido abordada por el proyecto CLOUDX-I (Cloud based software solution for next generation diagnostics in infectious diseases). El profesor Roy Sleator, coordinador del proyecto, comenta: «El proyecto CLOUDX-I se centró en el desarrollo de nuevas técnicas computacionales destinadas a favorecer el diagnóstico y pronóstico de infecciones neonatales. Las técnicas experimentales de cultivo microbiológico tradicionales carecen a menudo de la especificidad y la sensibilidad necesarias, lo que conduce frecuentemente a resultados falsos negativos en el diagnóstico. Es más, estas no tienen en cuenta la respuesta derivada del huésped y, por tanto, proporcionan muy pocos datos con valor pronóstico». Descubiertos nuevos biomarcadores de infección bacteriana relevantes El proyecto seleccionó diez bacterias clave para llevar a cabo la secuenciación del ADN empleando un análisis de polimorfismos de nucleótido simple (SNP). Las especies eran Enterococcus faecalis, un patógeno oportunista, y Staphylococcus aureus (S. aureus), notorio por el aumento de su resistencia a antibióticos. Las dos bacterias pueden causar sepsis en recién nacidos. Los investigadores han logrado identificar biomarcadores específicos precisos para los principales patógenos responsables de infecciones neonatales. Es más, estos están relacionados con loci genéticos concretos implicados con características fisiológicas y mecanismos relevantes en estos patógenos, incluyendo la formación de biopelículas y la resistencia a antibióticos. Computación ultrarrápida en la nube CLOUDX-I abordó el análisis de datos masivos de los resultados de secuenciación empleando el marco de trabajo Apache Hadoop, basado en la nube. Asimismo, se incrementó por diez la velocidad de análisis de S. aureus. También se construyeron clústeres de ordenadores para llevar a cabo el alineamiento múltiple simultáneo de secuencias genéticas. Para mejorar la eficacia del procesamiento y uso de memoria, los investigadores desarrollaron una nueva versión paralela de CloudBlast, un recurso público para el alineamiento masivo de secuencias genéticas. «Esta herramienta puede ejecutarse en equipos informáticos básicos con un bajo consumo de memoria y, además, es compatible con las mayores bases de datos, como NCBI NR/NT y Uniprot», explica el profesor Sleator. NCBI es una base de datos de secuencias procedentes de varias fuentes, incluyendo GenBank y Protein Data Bank, mientras que UniProt es una base de datos de secuencias de proteínas con su función correspondiente. Difusión mediática mundial El equipo del proyecto impartió seis talleres de trabajo especializados en la transferencia del conocimiento destinados a investigadores noveles en el campo del diagnóstico molecular y la computación en la nube. También se han organizado dos simposios científicos internacionales en torno a CLOUDX-1 y que contaron con la participación de todos los socios. En conjunto, las actividades del proyecto condujeron a la publicación de cincuenta artículos en revistas científicas internacionales con revisión por pares y varias notas de prensa, así como a la participación en seis simposios internacionales y ferias comerciales y tres eventos de divulgación. Dos artículos destacan sobre el resto debido a su gran relevancia y futura repercusión en el campo de la biología computacional. El primero, «Big data, Hadoop and cloud computing in genomics», fue publicado en la revista Journal of Biomedical Informatics y fue el cuarto artículo más descargado de la revista en un trimestre. En segundo lugar, y (como curiosidad) por limitaciones en el tamaño de la muestra (por restricciones éticas), el equipo colaboró con la empresa nSilico y otros dos laboratorios para evaluar la viabilidad de emplear un modelo murino en vez de un sistema humano neonatal para estudiar la respuesta del huésped a patógenos bacterianos. El artículo, titulado «Recapitulation of human neonatal immune signatures in newborn infected mice», está actualmente en proceso de revisión. El profesor Sleator resume el impacto del proyecto CLOUDX-I. «Además de desarrollar una plataforma computacional precisa y fácil de usar basada en la nube a fin de favorecer un diagnóstico y pronóstico más rápido y eficaz de infecciones neonatales, el proyecto ha logrado asimismo formar a biólogos en ciencia computacional y proporcionar a expertos informáticos una mejor comprensión de cuestiones clínicas relevantes. Estas actividades formativas han dado lugar a una nueva generación de investigadores jóvenes dotados con un conjunto de habilidades únicas, que probablemente ayudarán al desarrollo de otras herramientas informáticas de gran relevancia clínica (como Simplicity) y con potencial para salvar vidas».
Palabras clave
Recién nacido, enfermedad infecciosa, nube, datos, análisis, CLOUDX-I