Tworzenie fundamentów przyszłych baz danych dotyczących dynamiki molekularnej
Naukowcy z Barcelony w Hiszpanii opracowali bezpłatne i ogólnodostępne repozytorium symulacji dynamiki molekularnej o nazwie BioExcel-CV19. Powstała przy wsparciu finansowanych przez UE projektów MDDB oraz BioExcel-2 i BioExcel-3 baza danych pomoże rzucić światło na molekularne podłoże infekcji SARS-CoV-2. Jej opis można znaleźć w artykule opublikowanym w czasopiśmie „Nucleic Acids Research”. Na całym świecie generowane są ogromne ilości danych z symulacji dynamiki molekularnej, przy pomocy której analizuje się fizyczne ruchy atomów i cząsteczek. Dane te nie są jednak zazwyczaj dostępne dla szerszej społeczności naukowej. Ponadto, dotychczasowe próby zapewnienia bezpieczeństwa i możliwości ponownego wykorzystania danych dynamiki molekularnej opierały się na prostych bazach danych, które nie oferują użytkownikom realnego rozwiązania, ponieważ zapewniają jedynie ograniczony zestaw standardowych analiz na pojedynczych krótkich trajektoriach. Naukowcy potrzebują bazy danych, która umożliwi elastyczne analizy, także dużych systemów. Tutaj właśnie decydująca okazuje się baza BioExcel-CV19.
Rewolucja w bazach danych dynamiki molekularnej
Platforma zapewnia naukowcom dostęp online do atomistycznych trajektorii dynamiki molekularnej makrocząsteczek związanych z COVID-19. Zawarte w niej ważne informacje umożliwiają badanie ról kluczowych białek SARS-CoV-2, w tym białka kolca, enzymu konwertującego angiotensynę 2, domeny wiążącej receptor, polimerazy, nukleoprotein i białek błonowych. W sierpniu 2023 r. w bazie znajdowało się ponad 10 000 trajektorii. Są one prezentowane wraz ze zbiorem analiz kontroli jakości i informacji o systemie. Wszystkie dane będące owocem projektu można pobierać za pomocą interfejsu API REST. Z platformą zintegrowana jest także aplikacja o nazwie Jupyter Notebooks, która umożliwia użytkownikom końcowym w pełni zindywidualizowaną metaanalizę danych. Aby zalogować się do bazy BioExcel-CV19, nie trzeba spełniać żadnych wymagań, a dostęp jest bezpłatny i otwarty dla wszystkich użytkowników. „Nasza platforma przynosi rewolucję w bazach danych dynamiki molekularnej, gdyż umożliwia badanie dużych systemów i długich trajektorii, a jednocześnie zapewnia płynną integrację z nowoczesnymi symulacjami dynamiki molekularnej”, twierdzi starszy autor badania dr Modesto Orozco pracujący w hiszpańskim Instytucie Badań Biomedycznych (IRB Barcelona), który był koordynatorem projektu MDDB oraz partnerem projektów BioExcel-2 i BioExcel-3. Jego wypowiedź przytoczono w artykule na stronie „EurekAlert!”. „Baza łączy trajektorie opracowane przez różne grupy badawcze, dzięki czemu stanowi doskonały przykład tego, jak współpraca sprzyja odkryciom naukowym”, dodaje uczony. Omawiana baza danych powinna mieć istotne znaczenie dla takich dziedzin nauki, jak wirusologia, genomika, biologia strukturalna i molekularna, projektowanie leków, uczenie maszynowe i symulacja biomolekularna. Jeśli chodzi o symulacje biomolekularne, naukowcy mogą wykorzystać duże ilości danych dostępnych w bazie BioExcel-CV19 do ulepszania algorytmów i pól siłowych dynamiki molekularnej. Ponowna analiza i ponowne wykorzystanie danych daje możliwość prowadzenia metaanaliz i zwiększa szansę nowych odkryć. „Platformy takie jak BioExcel-CV19 powinny stać się standardem, podobnie jak w przypadku Protein Data Bank (PDB) w dziedzinie biologii strukturalnej”, stwierdza współautor badania dr Adam Hospital, również z IRB Barcelona, który kierował tymi pracami wraz z dr. Orozco. Realizacja projektu BioExcel-2 (BioExcel Centre of Excellence for Computational Biomolecular Research) zakończyła się w 2022 r. Zakończenie projektów MDDB (Molecular Dynamics Data Bank. The European Repository for Biosimulation Data) i BioExcel-3 (BioExcel Centre of Excellence for Computational Biomolecular Research) zaplanowane jest na rok 2026. Więcej informacji: projekt MDDB strona projektu BioExcel
Słowa kluczowe
MDDB, BioExcel-2, BioExcel-3, COVID-19, SARS-CoV-2, dynamika molekularna, białko, dane, baza danych, biomolekularne