Un nouvel outil d'information pour les chercheurs travaillant avec les biopuces
Sous l'égide de l'UE, le projet TEMBLOR a créé des connexions entre différentes ressources de données afin de faciliter les recherches en biologie moléculaire effectuées à travers l'Europe. Son objectif était de combiner les forces des différents groupes européens travaillant sur de nombreux aspects de classification et de caractérisation de gènes et de protéines et permettre ainsi d'améliorer l'interopérabilité des bases de données biologiques. Dans le cadre de ce projet, ArrayExpress a été conçu comme un référentiel public où les données d'expression génétique obtenues à partir des biopuces à ADN peuvent être consultées. La technologie des biopuces utilise les séquences génétiques obtenues à partir des projets de génomique pour tenter de répondre à la question suivante: «Quels gènes sont exprimés dans ce type d'organisme, à un moment donné et dans certaines conditions?». Les biopuces ADN sont maintenant considérées comme étant l'une des avancées les plus importantes réalisées dans le domaine des sciences de la vie expérimentales. La technologie ArrayExpress se compose de la base de données elle-même, d'un chargeur de données et d'une interface d'accès aux données. Elle fonctionne sous Oracle. Toutefois, très peu de fonctions spécifiques à Oracle sont utilisées, ce qui permet le transfert sur d'autres systèmes de gestion de base de données (SGBD). La connexion des bases de données va se faire par une catégorisation des ensembles d'objets classés de façon univoque par tableaux; de plus, chaque objet peut être distribué sur plusieurs tableaux en fonction de sa hiérarchie d'héritage. Certaines modifications du modèle objet ont été effectuées afin d'améliorer les performances des requêtes de recherche. Des informations complémentaires sont disponibles sur le site http://www.ebi.ac.uk/arrayexpress