Integración para maximizar la recuperación de información
Desentrañar y secuenciar el genoma de un organismo es ya toda una hazaña. Para poder aprovechar plenamente las secuencias de los genes, sin embargo, esta información debe conectarse con los vehículos de la transcripción y las proteínas codificadas relacionados con ellos. Si se vincula esta información con las enfermedades genéticas, sus bases biomoleculares y las interacciones moleculares se puede facilitar el desarrollo de fármacos y terapias. Al tomar conciencia del potencial de tales niveles de integración, el proyecto TEMBLOR se tradujo en un aumento del valor de los recursos europeos en estos ámbitos intrínsecamente relacionados. Se han desarrollado nuevos servicios relacionados con las interacciones proteína-proteína, las estructuras macromoleculares, los datos de micromatrices y las consultas integrativas. Entre ellos, y fundamental para la filosofía de los datos integrados, el portal de Internet Integr8, que ha posibilitado el acceder fácilmente a la información integrada acerca de los genomas descifrados y sus correspondientes proteomas. Centrándose en la secuencia de datos de un gen, el usuario es capaz de ver cómo se relacionan entre sí la genómica, la transcripción de los genes y las estructuras de las proteínas. La Fundación Wellcome Trust (Cambridgeshire, Reino Unido), como parte del Consorcio para la ontología de genes (Gene ontology consortium o GOC) desde 2001, fue la responsable de la anotación del proteoma humano. Posteriormente, a partir de 2006, la fundación continuó con sus actividades de investigación genómica y coordinación como parte del proyecto europeo GOA. Las anotaciones se ampliaron entonces para incorporar una gama de proteomas relacionados con enfermedades. La base de conocimientos de UniProt, la UniProtKB, abarca unas cien mil especies y es la mayor colección de información sobre familias de proteínas del mundo. La UniProtKB incorpora información sobre proteínas empezando por los seres humanos hasta las plantas, para continuar descendiendo en la escala evolutiva hasta llegar a los virus. También incluye los modelos animales más populares de Drosophila, Xenopus y el pez cebra. La actualización continua de los datos por parte de GOA ha garantizado y garantizará que éstos ofrezcan una fuente de anotaciones de referencia completa para la base de datos UniProt. Estas anotaciones han dado lugar a colaboraciones a escala mundial, además de contribuir a mejorar la visibilidad europea en el ámbito de la genómica y la proteómica.