Forschungsdatenmanagement (FDM)
Informieren & Beraten
Forschungsdaten sind laut Kindling und Schirmbacher (2013) „alle digital vorliegenden Daten, die während des Forschungsprozesses entstehen oder ihr Ergebnis sind.“ Die DFG (2015) zählt als Forschungsdaten „u. a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Surveydaten, Objekte aus Sammlungen oder Proben, die in der wissenschaftlichen Arbeit entstehen, entwickelt oder ausgewertet werden [sowie] methodische Testverfahren, wie Fragebögen, Software und Simulationen.“
Forschungsdatenmanagement (FDM) verfolgt das Ziel, langfristig den Zugang zu sowie die Nachnutzbarkeit und Überprüfbarkeit von Forschungsdaten zu ermöglichen. Im Verlauf des Forschungsdatenlebenszyklus können dafür jeweils passende Maßnahmen durchgeführt werden, um diese Zielstellung zu erreichen.
Diese und weitere Informationen über Forschungsdaten (zusammengestellt von Elisabeth Böker) und
Forschungsdatenmanagement (FDM) finden Sie auf der Informationsplattform forschungsdaten.info.
Der Forschungsdatenlebenszyklus veranschaulicht die verschiedenen Stadien, die Forschungsdaten im Rahmen eines Forschungsvorhabens idealtypisch durchlaufen. Es gibt mehrere Darstellungen des Forschungsdatenlebenszyklus, die sich in Einzelheiten voneinander unterscheiden. Für die Erläuterung der einzelnen Stationen wird hier der Lebenszyklus von forschungsdaten.info verwendet:
1. Bei der Planung des Vorhabens sollten Sie u. a. diese Fragen berücksichtigen:
- Welche Daten werden für das Vorhaben verarbeitet?
- Welche vorhandenen Daten existieren bereits?
- Wo und wie werden die Daten gespeichert, versioniert und gelöscht?
- Welche Maßnahmen sind für eine spätere Veröffentlichung notwendig (z. B. Zustimmung bei Personendaten)?
2. Bei der Datenerhebung sollten Sie u. a. diese Fragen berücksichtigen:
- Welche Experimente, Messungen etc. werden durchgeführt?
- Unter welchen Bedingungen können Daten nachgenutzt werden? Muss eine Erlaubnis eingeholt werden?
3. Bei der Datenaufbereitung und -analyse sollten Sie u. a. diese Fragen berücksichtigen:
- Wie werden die Daten digitalisiert, codiert, anonymisiert sowie geprüft und bereinigt?
- Wie erfolgen Sicherung, Verwaltung und langfristige Datenhaltung?
- Wie werden die Daten beschrieben und interpretiert?
4. Beim Teilen und Publizieren von Daten sollten Sie u. a. diese Fragen berücksichtigen:
- Unter welcher Lizenz sollen die Daten veröffentlicht werden?
- Unter welchen Bedingungen wird der Zugang zu den Daten ermöglicht?
- Wie und wo soll der Datensatz geteilt und veröffentlicht werden?
5. Bei der Datenarchivierung sollten Sie u. a. diese Fragen berücksichtigen:
- Welche Formate und Medien eignen sich für die (Langzeit-)Archivierung?
- Welche Metadaten sind für die Beschreibung der Daten notwendig?
- Wie muss die Dokumentation der Datennutzung erfolgen?
6. Für die Nachnutzung Ihrer Daten sollten Sie u. a. diese Fragen berücksichtigen:
- Können die Forschungsergebnisse anhand der Daten nachvollzogen und überprüft werden?
- Können die Daten für weitere Untersuchungen genutzt werden?
Diese und weitere Informationen finden Sie auf der Plattform forschungsdaten.info.
Die Bibliothek berät Sie u. a. zu diesen Themen:
- Erstellung eines Datenmanagementplans (DMP)
- Möglichkeiten der Veröffentlichung von Forschungsdaten (Repositorien, Data Journals)
- Vergabe von Metadaten
- Zitierung von Forschungsdaten(sätzen)
Melden Sie sich unter openaccess@thi.de.
Bei rechtlichen Fragen rund um FDM wenden Sie sich bitte an die Stabsstelle Recht.
Bei Datenschutzbelangen wenden Sie sich bitte an die Stabsstelle Digitalisierung.
Bei Fragen rund um FDM in Projektanträgen wenden Sie sich bitte an die Stabsstelle Forschung und Transfer.
Bei fachbezogenen Fragen stehen Ihnen ergänzend dazu Helpdesks der Nationalen Forschungsdateninfrastruktur (NFDI) zur Verfügung, z. B.:
- NFDI4Ing: Plattform für den Dialog zum FDM in allen Ingenieurwissenschaften mit Fragen und Antworten aus der Community
- NFDI-MatWerk: Kontaktformular als zentrale Stelle bei Fragen zum FDM in den Materialwissenschaften und Werkstofftechnik
Die NFDI bietet einen Überblick über die Helpdesks einzelner Konsortien.
Die Plattform forschungsdaten.info bietet einen Überblick über allgemeine FDM-Schulungsmöglichkeiten. Dort finden Sie u. a. Lehrvideos und Selbstlernkurse. Darüber hinaus werden fachspezifische Angebote vorgestellt, z. B. für Ingenieurwissenschaften und Lebenswissenschaften.
Die Vernetzungs- und Austauschplattform fdm-bayern.org betreibt einen YouTube-Kanal mit Videos über verschiedene Aspekte des FDM.
Außerdem finden Sie u. a. auf diesen Portalen Schulungsmaterialien zum FDM:
- ZOERR: Zentrales Open Educational Resources Repositorium der Hochschulen in Baden-Württemberg
- OERSI: Suchindex für Open Educational Resources in der Hochschullehre
- TIB AV-Portal: Open-Access-Video-Plattform der TIB Hannover
- ORCA.nrw: das Landesportal für Studium und Lehre (Nordrhein-Westfalen)
- Zenodo: generisches Repositorium des CERN
Finden & Nachnutzen
Offene Daten – Open Data – können ohne Einschränkungen genutzt und verbreitet werden. Die Möglichkeiten der Weiterverwendung sind dabei über offene Lizenzen – meist Creative Commons – kenntlich. [7]
Da es aus verschiedenen Gründen (z. B. Datenschutz oder wirtschaftliche Verwertungsinteressen) oft nicht möglich ist, Primärdaten komplett offen zur Verfügung zu stellen, ist das Ziel bei der Veröffentlichung von Daten, diese möglichst FAIR zugänglich zu machen.
Die FAIR-Prinzipien besagen, dass Forschungsdaten auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reuseable) veröffentlicht werden sollen. Sollen also sensible Daten zugänglich gemacht werden, ist die Ablage in einem Repositorium, dass eine Datennutzung nur nach vorheriger Authentifizierung und Autorisierung ermöglicht, im Einklang mit den FAIR-Prinzipien.
Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
Oft werden Forschungsdaten in Repositorien abgelegt. Um passende Repositorien aufzufinden, stehen u. a. Re3Data, OpenDOAR und RIsources zur Verfügung.
Um direkt nach Forschungsdaten zu suchen, können z. B. die Suchmaschinen DataCite Commons, das European Union Open Data Portal, B2FIND oder Google Dataset Search genutzt werden.
Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
Erheben & Aufbereiten
Mit einem Datenmanagementplan (DMP) wird der Umgang mit Forschungsdaten während und nach Abschluss eines wissenschaftlichen Projekts beschrieben. Ein DMP ist ein sinnvolles Hilfsmittel, das der Projektleitung und allen Projektbeteiligten über die gesamte Dauer und den Forschungsdatenlebenszyklus hinweg den Überblick über Datenhaltung und -verwaltung ermöglicht.
Die Erstellung eines DMP kann unabhängig davon, ob eine Publikation der Daten angestrebt wird, sinnvoll sein, da Lücken und Unklarheiten in Bezug auf den Umgang mit den erstellten Forschungsdaten frühzeitig und umfassend ausgeräumt werden können. Die Art der Daten, der dafür benötigte Speicherplatz sowie Zugriffsrechte während und nach Ende des Projekts sind ein paar Aspekte, die in einem DMP geklärt und dokumentiert werden können.
Mehrere Forschungsfördereinrichtungen fordern Angaben zum Umgang mit Forschungsdaten in Anträgen. Meist wird dabei kein formaler DMP erwartet, die Umsetzung dieser Förderbedingung kann mit einem DMP jedoch erleichtert werden. Die Vorgaben der forschungsfördernden Institutionen sind auf der Informationsplattform forschungsdaten.info in einer Übersicht dargestellt.
Ein verbreitetes Tool zur Erstellung eines DMP ist der Research Data Management Organiser (RDMO). Frei verfügbare Installationen werden von forschungsdaten.info und NFDI4Ing zur Verfügung gestellt. Der Login ist jeweils u. a. mit Ihrer ORCID ID möglich.
Die Deutsche Forschungsgemeinschaft (DFG) bietet eine Checkliste zum Inhalt eines DMP. Die Plattform DMPonline, die ebenfalls zur Erstellung von DMP genutzt werden kann, führt eine Liste mit öffentlich einsehbaren DMP, die als Beispiele genutzt werden können (nicht qualitätsgeprüft).
Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
Eine von vornherein geregelte Strukturierung, Dokumentation und Sicherung der Forschungsdaten kann für eine erhebliche Reduzierung von Aufwand und Zeit in der alltäglichen Forschungsarbeit sorgen. Dazu zählen so grundlegende Festlegungen wie eine klar geregelte Ordnerstruktur und -benennung im Rahmen eines Projekts, die für alle Beteiligten bindend ist. Empfehlenswert ist dabei eine Ordnerhierarchie, die aus höchstens drei Ebenen besteht. Außerdem sollte eine klare Regelung für die Datenlöschung nach Projektende getroffen werden. Alle Festlegungen sollten dabei schriftlich dokumentiert und allen Projektbeteiligten bekannt und jederzeit zugreifbar gemacht werden.
Für die erhobenen Daten(sätze) selbst ist es entscheidend, Veränderungen durch eine funktionale Versionskontrolle nachvollziehbar zu machen. Dies kann durch eine präzise Benennungskonvention erreicht werden, in der eine Versionsnummer und das Änderungsdatum (bestenfalls in der Form YYYYMMDD) enthalten ist. Final bearbeitete Datensätze sollten eine entsprechende Kennzeichnung erhalten. Um Datenverlust möglichst zu vermeiden, empfiehlt es sich, regelmäßig Versionen, die nicht gelöscht oder verändert werden dürfen, an einem weiteren Speicherort zu sichern.
Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
Veröffentlichen & Archivieren
Die Veröffentlichung von Forschungsdaten dient v. a. der guten wissenschaftlichen Praxis und wird an mehreren Stellen des Kodex Leitlinien zur Sicherung guter wissenschaftlichen Praxis der Deutschen Forschungsgemeinschaft (DFG) adressiert.
Besonders relevant ist dafür Leitlinie 12: Dokumentation, die beschreibt, dass zur Bewertung und Überprüfung von Forschungsergebnissen sämtliche relevanten Informationen zu deren Entstehung nach fachspezifischen Standards dokumentiert werden müssen. Dabei sind Maßnahmen zum Schutz vor Manipulation zu treffen und Dritten der Zugang zu diesen Informationen zu ermöglichen. Neben Forschungsdaten betrifft dies u. a. auch Methode, Auswertung und Analyse sowie Quellcode von Forschungssoftware.
In Leitlinie 13: Herstellung von öffentlichem Zugang zu Forschungsergebnissen wird eingangs dargelegt, dass es in Einzelfällen begründet sein kann, Ergebnisse nicht zu veröffentlichen. Forschende treffen eigenverantwortlich und auf Grundlage von Gepflogenheiten des jeweiligen Fachgebiets die Entscheidung der Veröffentlichung. Forschungsdaten sollen dabei unter Berücksichtigung der FAIR-Prinzipien (s. auch Abschnitt “Wie können Forschungsdaten FAIR veröffentlicht werden?”) in zuverlässigen Repositorien zugänglich gemacht werden.
Der Umgang mit Forschungsdaten wird außerdem u. a. in Leitlinie 10: Rechtliche und ethische Rahmenbedingungen, Nutzungsrechte und Leitlinie 17: Archivierung geregelt. Einen Überblick zu den Aussagen des Kodex zu Forschungsdaten gibt die Informationsplattform forschungsdaten.info.
Die FAIR-Prinzipien besagen, dass Forschungsdaten auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reuseable) veröffentlicht werden sollen.
Um die Auffindbarkeit zu gewährleisten, müssen die Daten u. a. mit umfangreichen Metadaten beschrieben werden und einen persistenten Identifikator (z. B. DOI) bekommen. Außerdem ist die Indexierung der (Meta-)Daten in einer Suchmaschine oder Datenbank notwendig.
Die Zugänglichkeit zu den (Meta-)Daten soll über ein standardisiertes und offenes Kommunikationsprotokoll möglich sein, das bei Bedarf eine Authentifizierung und Autorisierung ermöglicht. Die Metadaten bleiben abrufbar, auch wenn die Verfügbarkeit der eigentlichen Forschungsdaten nicht (mehr) gegeben ist.
Im Kontext der Interoperabilität werden die genutzten Sprachen und Vokabularien für die (Meta-)Daten beschrieben. Außerdem sollen die (Meta-)Daten jeweils sinnvoll mit weiteren (Meta-)Daten verknüpft werden.
Die Wiederverwendbarkeit zielt v. a. auf die Beschreibung der Daten ab. Dabei sind der Entstehungskontext der Daten, die Verwendung einer Nutzungslizenz sowie fachspezifische Standards zu berücksichtigen.
Diese und weitere ausführliche Informationen zu den FAIR-Prinzipien sowie Erläuterungen zu ihrer Umsetzung bietet GO FAIR.
Zur reinen Beschreibung komplexer und bedeutsamer Datensätze eignen sich Artikel in Data Journals. Analog zu klassischen Forschungsartikeln in wissenschaftlichen Journals durchlaufen sie ein Begutachtungsverfahren. Einen Überblick über Data Journals bietet u. a. das Portal forschungsdaten.org. [8]
Der beschriebene Datensatz sollte separat in einem geeigneten Repositorium veröffentlicht werden. Bei der Auswahl sind fachspezifische Standards und Vorgaben der Förderinstitutionen oder von Verlagen zu beachten. Auch eine angestrebte Langzeitarchivierung sollte berücksichtigt werden.
Wenn ein passendes fachliches Repositorium existiert, sollte die Veröffentlichung der Forschungsdaten dort erfolgen. Die Verzeichnisse Re3Data und RIsources ermöglichen eine fachspezifische Suche nach Repositorien.
Stehen keine geeigneten fachlichen Repositorien zur Verfügung, können generische Repositorien genutzt werden, z. B. Zenodo.
Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
Um die langfristige Nachnutzbarkeit Ihrer Forschungsdaten zu gewährleisten, sollten Sie für die Veröffentlichung Dateiformate nutzen, die mit verschiedenen Systemen kompatibel, möglichst langfristig archivierbar und verlustfrei konvertierbar sind.
Bei der Datenerhebung werden i. d. R. spezielle Programme verwendet, die in den Fachgebieten verbreitet und auf die Erhebungsmethode gezielt ausgerichtet sind. Dabei werden meistens eigene Dateiformate genutzt. Steht eine Exportfunktion zur Verfügung, die eine Speicherung in einem alternativen, nach den oben genannten Kriterien für die Veröffentlichung besser geeigneten Dateiformat ermöglicht, sollte diese genutzt werden. Die Informationsplattform forschungsdaten.info hat eine Übersicht zu Dateiformaten erstellt, die sich für eine Veröffentlichung langfristig oder mittelfristig eignen oder als ungeeignet angesehen werden.
Wenn eine Konvertierung in ein anderes Dateiformat notwendig ist, muss die Entscheidung getroffen werden, ob diese Konvertierung verlustfrei, verlustbehaftet oder sinnhaft erfolgen soll. Eine verlustbehaftete Konvertierung kann gegenüber einer verlustfreien Konvertierung von Vorteil sein, wenn eine geringere Dateigröße angestrebt wird. Erfolgt diese verlustbehaftete Konvertierung so, dass alle wesentlichen Inhalte erhalten bleiben (also sinnhaft), kann dies ausreichend sein.
Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
Quellen und weiterführende Links
Böker, E., 2024. Was sind Forschungsdaten? Definitionsvorschläge [online]. 23. August 2024 [Zugriff am: 28. November 2024]. Verfügbar unter: https://forschungsdaten.info/themen/informieren-und-planen/was-sind-forschungsdaten/
DEUTSCHE FORSCHUNGSGEMEINSCHAFT, o. J. Leitlinie 10. Rechtliche und ethische Rahmenbedingungen, Nutzungsrechte [online] [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://wissenschaftliche-integritaet.de/kodex/rechtliche-und-ethische-rahmenbedingungen-nutzungsrechte/
DEUTSCHE FORSCHUNGSGEMEINSCHAFT, o. J. Leitlinie 12. Dokumentation [online] [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://wissenschaftliche-integritaet.de/kodex/dokumentation/
DEUTSCHE FORSCHUNGSGEMEINSCHAFT, o. J. Leitlinie 13. Herstellung von öffentlichem Zugang zu Forschungsergebnissen [online] [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://wissenschaftliche-integritaet.de/kodex/herstellung-von-offentlichem-zugang-zu-forschungsergebnissen/
DEUTSCHE FORSCHUNGSGEMEINSCHAFT, o. J. Leitlinie 17. Archivierung [online] [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://wissenschaftliche-integritaet.de/kodex/archivierung/
Deutsche Forschungsgemeinschaft, 2015. Leitlinien zum Umgang mit Forschungsdaten [online]. 30. September 2015 [Zugriff am: 28. November 2024]. Verfügbar unter: https://www.dfg.de/resource/blob/172112/4ea861510ea369157afb499e96fb359a/leitlinien-forschungsdaten-data.pdf
GO FAIR INTERNATIONAL SUPPORT AND COORDINATION OFFICE, o. J. FAIR Principles [online] [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://www.go-fair.org/fair-principles/
Kindling, M. und P. Schirmbacher, 2013. „Die digitale Forschungswelt“ als Gegenstand der Forschung / Research on Digital Research / Recherche dans la domaine de la recherche numérique [online]. Information - Wissenschaft & Praxis, 64(2-3), S. 127-136. ISSN 1619-4292. Verfügbar unter: https://doi.org/10.1515/iwp-2013-0017
UNIVERSITÄT KONSTANZ, 2023. Datenjournale. Peer-Review-Publikationen über Daten [online]. 5. Mai 2023 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/datenjournale/
UNIVERSITÄT KONSTANZ, 2023. Datenorganisation. Grundlagen der Datenverwaltung [online]. 5. Mai 2023 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/organisieren-und-aufbereiten/datenorganisation/
UNIVERSITÄT KONSTANZ, 2023. Förderrichtlinien. Anforderungen an drittmittel-geförderte Projekte [online]. 5. Mai 2023 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/informieren-und-planen/foerderrichtlinien/#c492536
UNIVERSITÄT KONSTANZ, 2023. Formate erhalten. Inhalte langfristig sichern [online]. 24. Juli 2023 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/formate-erhalten/
UNIVERSITÄT KONSTANZ, 2023. Forschungsdaten finden. Daten finden und wiederverwenden [online]. 5. Mai 2023 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/finden-und-nachnutzen/forschungsdaten-finden/
UNIVERSITÄT KONSTANZ, 2023. Open Data, Open Access und Nachnutzung. Barrierefreier Zugang zu Forschungsdaten [online]. 5. Mai 2023 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/finden-und-nachnutzen/open-data-open-access-und-nachnutzung/
UNIVERSITÄT KONSTANZ, 2023. Repositorien. Daten professionell zur Verfügung stellen [online]. 5. Mai 2023 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/repositorien/
Universität Konstanz, 2023. Was ist Forschungsdatenmanagement? Aus kleinem Anfang entspringen alle Dinge [online]. 5. Mai 2023 [Zugriff am: 28. November 2024]. Verfügbar unter: https://forschungsdaten.info/themen/informieren-und-planen/was-ist-forschungsdatenmanagement/
Universität Konstanz, 2024. Der Datenlebenszyklus. Stationen des Forschungsdatenmanagements [online]. 9. September 2024 [Zugriff am: 28. November 2024]. Verfügbar unter: https://forschungsdaten.info/themen/informieren-und-planen/datenlebenszyklus/
UNIVERSITÄT KONSTANZ, 2024. Der Datenmanagementplan. Eine Wegbeschreibung für Daten [online]. 9. Februar 2024 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/informieren-und-planen/datenmanagementplan/
UNIVERSITÄT KONSTANZ, 2024. FAIRe Daten. Wie die FAIR-Prinzipien umgesetzt werden können [online]. 6. März 2024 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/faire-daten/
UNIVERSITÄT KONSTANZ, 2024. Gute wissenschaftliche Praxis und FDM. Ein Überblick über die DFG Leitlinien [online]. 2. Mai 2024 [Zugriff am: 8. Mai 2024]. Verfügbar unter: https://forschungsdaten.info/themen/ethik-und-gute-wissenschaftliche-praxis/gute-wissenschaftliche-praxis-und-fdm/
Kontakt
Bei Fragen wenden Sie sich gerne an uns:
Telefon: 0841/93482160