Préparer le terrain pour les futures bases de données de dynamique moléculaire
Des chercheurs de Barcelone, en Espagne, ont mis au point un référentiel libre et gratuit pour les simulations de dynamique moléculaire (DM), baptisé BioExcel-CV19. Soutenue par les projets MDDB et BioExcel-2 et BioExcel-3 financés par l’UE, la base de données permettra de mieux comprendre les subtilités moléculaires de l’infection par le SARS-CoV-2. Ses caractéristiques sont décrites dans un communiqué publié dans «Nucleic Acids Research». Un énorme volume de données est généré dans le monde entier à partir de simulations de DM qui analysent les mouvements physiques des atomes et des molécules. Toutefois, ces données ne sont généralement pas accessibles à la communauté scientifique. En outre, les efforts visant à rendre les données de DM sûres et réutilisables se sont, jusqu’à présent, appuyés sur des bases de données simples qui n’offrent pas de véritable solution aux utilisateurs de DM actuels, car elles ne fournissent qu’un ensemble limité d’analyses standard sur des trajectoires courtes uniques. Les scientifiques ont besoin d’une base de données qui permette des analyses flexibles et qui soit capable de gérer des systèmes de grande taille. C’est là qu’intervient BioExcel-CV19.
Un changement dans les bases de données de DM
La plateforme permet aux scientifiques d’accéder en ligne aux trajectoires atomistiques de DM des macromolécules impliquées dans la COVID-19. D’importantes informations permettent de mieux comprendre le rôle des protéines clés du SARS-CoV-2, notamment la protéine spike, l’enzyme de conversion de l’angiotensine 2, le domaine de liaison au récepteur, la polymérase, les nucléoprotéines et les protéines membranaires. En août 2023, la base de données contenait plus de 10 000 trajectoires. Les trajectoires obtenues sont assorties d’un ensemble d’analyses de contrôle de qualité et d’informations sur le système. Toutes les données produites par le projet peuvent être téléchargées à partir d’une interface de programmation d’applications REST. Une application appelée Jupyter Notebooks a également été intégrée à la plateforme, elle permet aux utilisateurs finaux de réaliser des méta-analyses entièrement personnalisées. Aucune exigence de connexion n’est requise pour BioExcel-CV19, qui est gratuit et ouvert à tous les utilisateurs. Cette base de données représente un changement des bases de données de dynamique moléculaire, conçues pour gérer de grands systèmes et de longues trajectoires tout en s’intégrant de manière homogène aux simulations modernes de DM», fait remarquer l’auteur principal de l’étude, le Dr Modesto Orozco, coordinateur du projet MDDB et partenaire des projets BioExcel-2 et BioExcel-3, à l’Institut de recherche en biomédecine (IRB Barcelone), en Espagne, dans un communiqué de presse publié sur «EurekAlert!». «Elle rassemble les trajectoires de divers groupes de recherche, mettant en évidence une approche collaborative qui favorise les découvertes scientifiques», ajoute le chercheur. La base de données aura un impact sur des domaines scientifiques tels que la virologie, la génomique, la biologie structurelle et moléculaire, la conception de médicaments, l’apprentissage automatique et la simulation biomoléculaire. En ce qui concerne la simulation biomoléculaire, les scientifiques peuvent utiliser les grandes quantités de données disponibles sur BioExcel-CV19 pour affiner les algorithmes et les champs de force de la DM. La réanalyse et la réutilisation des données créent des opportunités pour de nouvelles méta-analyses et découvertes. «Des plateformes comme BioExcel-CV19 devraient devenir une norme, à l’instar de la banque de données sur les protéines (PDB) en biologie structurelle», déclare le Dr Adam Hospital, coauteur de l’étude et également de l’IRB Barcelone, qui a dirigé ces travaux avec Modesto Orozco. Le projet BioExcel-2 (BioExcel Centre of Excellence for Computational Biomolecular Research) s’est achevé en 2022. MDDB (Molecular Dynamics Data Bank. The European Repository for Biosimulation Data) et BioExcel-3 (BioExcel Centre of Excellence for Computational Biomolecular Research) prendra fin en 2026. Pour plus d’informations, veuillez consulter: projet MDDB site web du projet BioExcel
Mots‑clés
MDDB, BioExcel-2, BioExcel-3, COVID-19, SARS-CoV-2, dynamique moléculaire, protéine, données, base de données, biomoléculaire