Beschreibung unseres einzigartigen Lebensbaums
Charles Darwin hat die Grundlagen der modernen Evolutionsbiologie mit zwei fundamentalen Konzepten festgelegt – alle Spezies sind über einen gemeinsamen Vorfahren miteinander verwandt, und die natürliche Auswahl reflektiert das Zusammenspiel zwischen Erbinformationen (modern gesprochen Genen) und der Umgebung, in der sich die Spezies entwickeln. Die Pfade der Abstammungen von Spezies von einem gemeinsamen Vorfahren werden traditionell als phylogenetischer Baum dargestellt. Auf ähnliche Weise können die Historien der Gene als Bäume dargestellt werden, diese können sich von der Historie der Spezies signifikant unterscheiden, weil Gene durch eine Vielzahl an evolutionären Ereignissen wie Duplizierung, Verlust oder lateralem Transfer beeinflusst werden können. Mit der EU-Finanzierung des Projekts "GENEFOREST" hatten die Wissenschaftler das Ziel, phylogenetische Methoden zu entwickeln, um mehrere Genbäume im Kontext eines Artenbaums zu rekonstruieren. Ihr Ziel war es, Modelle bereitzustellen, die über groß angelegte Rekonstruktionen von genomischen Prozessen, z. B. Genduplizierung, -transfer und -verlust (gene duplication, transfer and loss, DTL), auf sehr große Datensätze anwendbar sind. Derartige Methoden sind zwar sehr rechenintensiv, ermöglichen jedoch die Untersuchung kompletter Genome, statt nur einzelner Gene, und somit die Rekonstruktion der Historie dieser Genome. Diese Methoden stellen zudem interessanterweise auch Informationen zum Timing der Artendiversifizierung, und zwar sogar in Abwesenheit von Fossildaten. Als Machbarkeitsnachweis wurde das Wahrscheinlichkeitsmodell namens ODT (Origination, Duplication, Transfer and loss of genes, dtsch.: Herkunft, Duplizierung, Transfer und Verlust von Genen) verwendet, um die datierte Phylogenie von 36 cyanobakterielle Spezies unter Verwendung von über 8.000 Genfamilien zu rekonstruieren. Die Wissenschaftler haben ihr ODT-Modell erweitert, um das erste Modell der Genakquirierung und des -verlusts entlang ausgestorbener oder unbeprobten Abstammungen (extinct or unsampled lineages, exODT) abzuleiten. Diese Erweiterung verspricht, die Erforschung der enormen Vielfalt des ausgestorbenen Lebens zu ermöglichen, hat jedoch möglicherweise dazu beigetragen, Genome über uralte, laterale Gentransfers zu erweitern. Die Wissenschaftler haben zudem die erste Wahrscheinlichkeitsmethode entwickelt, um gleichzeitig den Artenbaum und alle die Genbäume zu ermitteln, die zusammen die Historie der Genome ausmachen, wodurch sie die Qualität beider Arten von Bäumen signifikant verbessert haben. Dieses Programm namens "PHYLDOG" wurde verwendet, um die evolutionäre Historie von 36 Säugetiergenomen zu rekonstruieren. Im abschließende Schritt haben die Forscher das exODT-Modell mit anderen Wahrscheinlichkeitsmodellen kombiniert, um das Modell der ungefähren Wahrscheinlichkeitsschätzung (approximate likelihood estimation, ALE) zu erhalten. ALE kann einen Genbaum mit bemerkenswerter Genauigkeit von einem gegebenen Artenbaum ableiten und ist in der Lage, bis zu 100 Genome zu berücksichtigen. Die umfassenden, groß angelegten Evolutionsmodelle der Genomevolution, die im Projekt "GENEFOREST" entwickelt wurden, haben großen Einfluss auf die Untersuchung der phylogenetischen Artenbäume, Genbäume und deren Wechselbeziehung.