BigData & Databolomics

Wir integrieren öffentliche Datensätze, oft Sequenzierdaten, in unsere Forschungsprojekte und nutzen diese auf innovative Weise (DataReuse/DataUpcycling). Damit lassen sich Fragestellungen nicht nur auf eine Pflanze gerichtet beantworten, sondern direkt über alle bisher sequenzierten Arten. Ein häufiges Problem ist dabei allerdings der Mangel an Metadaten also Informationen über den Ursprung von Proben und die Durchführung der Datengenerierung. Daher arbeiten wir an Methoden, um Lücken in Metadaten aus den Daten heraus zu schließen.

Eine große Herausforderung wird mittelfristig die Aufklärung von Genfunktionen sein. Während technologischer Fortschritt in der Sequenzierung die Entschlüsselung von Genomen erleichtert hat, ist die funktionale Annotation von einzelnen Genen noch immer ein aufwendiger Prozess. Weil nicht in allen Fällen eine Aufklärung von Genfunktionen durch knock-out des fraglichen Gens möglich ist, entwickeln wir Methoden für einen automatischen Transfer von Informationen zwischen verschiedenen Pflanzenspezies. Das langfristige Ziel ist eine Integration des gesamten Verfügbaren Wissens für Genfunktionen in Pflanzen. Unserer besonderer Fokus liegt auf Genen, die im spezialisierten Metabolismus aktiv sind.