Datenselektion

Nicht alle Forschungsdaten, die im Laufe eines Projektes entstehen, sind archivierungs- oder publikationswürdig. Gerade bei großen Datenmengen kann ein hoher Speicherbedarf für die Archivierung/Publikation zudem zu einem höheren Verwaltungsaufwand und folglich zu höheren Kosten führen. Es ist deshalb ratsam frühzeitig zu entscheiden, was mit welchen Daten geschehen soll.

Bei der Entscheidung kann z. B. die 5-Schritte-Anleitung des Digital Curation Centers (DCC) helfen.

Fünf Schritte zur Datenselektion

1. Identifizieren Sie Zwecke, die die Forschungsdaten erfüllen könnten.

2. Identifizieren Sie Forschungsdaten, die aufbewahrt werden müssen (z. B. durch vertragliche Festlegungen).

3. Identifizieren Sie Forschungsdaten, die aufbewahrt werden sollten (z. B. Daten, die langfristig von Wert sein könnten).

4. Wägen Sie die Kosten ab.

5. Vervollständigen Sie die Datenbeurteilung.

Bedenken Sie immer, welche Daten müssen aufbewahrt werden und wie lange, bzw. welche Daten müssen gelöscht werden und warum (bspw. personenbezogene Daten).

Ein Beispiel für einen Datensatz, der aufbewahrt und der Öffentlichkeit zur Verfügung gestellt werden sollte, sind Forschungsdaten, die einzigartig oder nur sehr schwer zu reproduzieren sind und die der Forschergemeinschaft von gutem Nutzen sein können. Forschungsdaten, die nur zu Testzwecken produziert wurden, müssen hingegen nicht archiviert oder publiziert werden.