Wykorzystanie wielkich ilości danych nt. genomu roślin
W ostatnich latach zakończenie poznawania sekwencji genomu rzodkiewnika oraz duże zbiory sekwencji innych roślin spowodowały, że rozpoczęto rozległe badania z zakresu genomiki funkcjonalnej. Jednakże dane te są wykorzystywane w sposób nieefektywny, ponieważ zbiory danych z dziedziny biologii molekularnej są rozproszone i heterogeniczne, a wysiłki mające na celu kompleksową integrację tych danych są bardzo zapóźnione. Najważniejszym celem projektu PLANET było pokonanie ograniczeń związanych z podejmowanie indywidualnych wysiłków i posiadaniem zbiorów danych z zakresu biologii molekularnej. Partnerzy projektu PLANET zastosowali inne niż powszechnie stosowane rozwiązanie w zakresie magazynowania danych i nie wysunęli propozycji stworzenia hurtowni danych, gdzie przechowywano by wszystkie dane z zakresu genomu roślin zebrane w pojedynczej bazie danych. Zamiast tego opracowano technologie sieci Web w celu dostępu do aktualnych zbiorów danych, które pozostały rozproszone, ale z dodanymi adnotacjami utworzonymi przez specjalistów. Program YAdumper został zaprojektowany przez partnerów projektu z Hiszpańskiej Narodowej Rady Badawczej i jest narzędziem ułatwiającym pobieranie ustrukturyzowanych informacji z rozproszonych baz danych. Ta napisana w języku Java aplikacja nie ma żadnych wstępnych założeń odnośnie bazy danych. Jako wejście danych wymagany jest zestaw zmiennych globalnych, funkcje formatowania oraz nazwa pliku wyjściowego, który może zostać zapisany w formacie XML lub innym. Szablon jest jedynym plikiem zapisanym na stałe w pamięci. Program YAdumper znacznie obniża wymagania odnośnie pamięci. Poprzez umożliwienie wysyłania zapytań do wielu baz danych i wykorzystywania skorelowanych zapytań znacznie ułatwione jest uzyskiwanie tysięcy powiązanych wierszy baz danych z zakresu biologii molekularnej. Program YAdumper jest tylko jedną z technologii sieci Web zaprojektowanych w ramach projektu PLANET i przewiduje się, że przyczyni się do systematycznego badania genomów rzodkiewnika i innych roślin.