Informationsmaterialien

Der Begriff „Forschungsdaten“ ist schwer zu fassen, da jede Fachdisziplin letztendlich ein eigenes Verständnis hat, was Forschungsdaten in dem entsprechenden Forschungsgebiet sind. Verallgemeinernd könnte man sagen, dass unter Forschungsdaten, diejenigen Daten zu verstehen sind, die im Laufe der verschiedensten fachrichtungsbezogenen Forschungsprozesse entstehen. Hierbei sind sowohl Rohdaten als auch die aus diesen abgeleiteten Forschungsergebnisse in Form von Publikationen inklusive der jeweils dazugehörigen Metadaten und Dokumentationen gemeint.

Lebenszyklus von Forschungsdaten

Das Modell des Datenlebenszyklus beschreibt Daten von deren Produktion über die Analyse und langfristigen Speicherung bis zur Zugänglichmachung und Nachnutzung. Hierzu existieren verschiedene Modelle.

Im Rahmen wissenschaftlicher Forschung entstehen digitale Daten unterschiedlichster Art. Für die dauerhafte und nachvollziehbare Bewahrung der Daten und für die mögliche Nachnutzung der Forschungsprimärdaten durch Dritte ist ein Management der Forschungsdaten erforderlich. Dieses betrifft jeden Teilschritt im Umgang mit Forschungsdaten, von der Projektplanung bis zur dauerhaften Speicherung von Daten.

Drittmittelgeber wie die Deutsche Forschungsgemeinschaft (DFG) oder die Europäische Union messen dem Forschungsdatenmanagement eine hohe Bedeutung bei und machen Vorgaben zum Forschungsdatenmanagement und auch zu Open Data in ihren Förderprogrammen.

Ein Datenmanagementplan beschreibt die im Rahmen eines Forschungsprojektes entstehenden digitalen Forschungsdaten und den geplanten Umgang mit diesen. Die Beschreibung beinhaltet dabei z.B. Angaben zu der Art der Daten und den Weg ihrer Erzeugung, verwendete Standards und Metadaten, die geplanten Maßnahmen zur Archivierung und Datenerhaltung. Darüber hinaus können DMPs Angaben über Zugriffsmöglichkeiten, Lizenzen, persistente Identifikatoren für die Datensätze oder auch Angaben zu Nutzungsmöglichkeiten über den ursprünglichen Zweck hinaus enthalten. Ein Datenmanagementplan ist ein dynamisches Dokument, dass an Änderungen im Projektverlauf angepasst wird.

Für die Erstellung von Datenmanagementplänen existieren bereits verschiedene Werkzeuge:

https://dmponline.dcc.ac.uk/Digital Curation Center (UK) (an Horizon 2020 angepasst)

https://dmptool.org/ University of California (USA) (Beispielpläne)

Zur Vermeidung von Datenverlusten sollten die Daten möglichst auf mehreren Speichermedien abgelegt werden. Es empfiehlt sich eine Datenspeicherung auf dem Universitätsserver, da für diesen regelmäßige Back-ups durchgeführt werden. Darüber hinaus sollte auf eine standardisierte Benennung geachtet werden, damit Datensätze auch nach längerer Zeit noch eindeutig identifiziert werden können. Zudem sollten die zu den Datensätzen gehörenden Metadaten erfasst und ebenfalls gespeichert werden. Des Weiteren ist, falls erforderlich (z.B. Schutz von personenbezogen Daten), für einen Zugriffsschutz zu sorgen.

Metadaten

Unter Metadaten in bibliothekarischer Hinsicht versteht man zusätzliche beschreibende Daten über Objekte, wie beispielsweise ein Buch oder eine Zeitschrift. Die Metadaten dienen dazu, Ressourcen einheitlich und strukturiert zu beschreiben. In diesem Zusammenhang sind Metadaten z.B. Angaben über den Autor oder das Erscheinungsjahr. Sollen beispielsweise Forschungsdaten in ein Repositorium eingestellt werden, sind Metadaten zum Verständnis des Datensatzes, für die Nachnutzbarkeit sowie für die Durchsuchbarkeit des Repositoriums notwendig. Zur einheitlichen Erfassung von Metadaten existieren allgemeine Standards wie z.B. Dublin Core als auch fachspezifische Standards wie ISO 19115 (Geowissenschaften).

Langzeitarchivierung

Die dauerhafte Speicherung von digitalen Daten ist eine große Herausforderung. Die Daten sollen nicht nur langfristig als Bitstream abgelegt werden, sondern auch lesbar und auffindbar bleiben. Da sich Softwareumgebungen und auch die Speichermedien beständig ändern, ist sowohl dafür zu sorgen, dass die zum Lesen und erstehen der Daten notwendigen Softwareumgebungen nachgebildet werden können (Emulation) und auch der Bitstream in seiner genauen Abfolge auf Dauer erhalten bleibt und dem ursprünglichen Bitstream entspricht. Es ist von Bedeutung nicht-proprietäre und dokumentierte Softwareformate zu verwenden. Die Langzeitarchivierung kann nur dann erfolgreich sein, wenn Sie standardisierten Abläufen folgt.

Datenveröffentlichung

Datenrepositorien bieten die Möglichkeit zur Veröffentlichung von Forschungs(roh)daten. Auf diese Weise werden auch Forschungs(roh)daten zitierbar und sind aber auch für andere Wissenschaftler/-innen nachnutzbar. Die JGU bietet demnächst zur Veröffentlichung und Speicherung von Forschungsdaten ein Repositorium an.

Eine Übersicht über ca. 1500 verschiedenste fachspezifische Datenrepositorien bietet re3data.

https://www.re3data.org/ .

Als allgemeines Repositorium für die Veröffentlichung von Artikeln und Forschungsprimärdaten kann z.B. „Zenodo“, das vom CERN betreut wird, verwendet werden. Datenpakete können bis zu einer Größe von 50 Gigabyte in Zenodo gespeichert werden. Neben der Open Data Option ist es auch möglich, Daten für eine gewisse Zeit zugriffsgeschützt abzulegen.

https://zenodo.org/

 

Persistente Identifikatoren (PID)

PIDs dienen dazu digitale Objekte eindeutig und dauerhaft zu identifizieren und auf diese Weise auffindbar zu halten. PIDs verhindern die Entstehung von dysfunktionalen Links, beispielsweise bei Änderung der Internetadresse eines Verlages. Es gibt verschiedene Arten von PIDs, wie beispielsweise DOI, Handle, URN etc.

Digital Object Identifier (DOI): http://www.doi.org/ Die DOI ist unter den PIDs am bekanntesten und auch international am weitesten verbreitet. DOIs sind im akademischen Bereich kostenfrei.

Handle: http://www.handle.net/ Handle ist ein weiterer international häufig verwendeter PID. Das DOI System basiert z.B. auf Handle. Ggf. mit geringen Kosten verbunden.

Uniform Resource Name (URN): http://www.dnb.de/DE/Netzpublikationen/URNService/urnservice_node.html URNs werden in Deutschland kostenlos über die Deutsche Nationalbibliothek vergeben und verwaltet. URNs werden für Publikationen vergeben und sind den meisten vermutlich aus Bibliotheken bekannt. URNs sind eher in Europa gebräuchlich.

Persistent Uniform Resource Locator (PURL): https://archive.org/services/purl/ werden vor allem in Nordamerika verwendet (z.B. in Bibliotheken) und ähneln einer HTTP Weiterleitung.

Im Zusammenhang mit Open Data wird oft gefordert, dass Daten FAIR sein sollen. D.h.:

Findable

Accessible

Interoperable

Reeusable

Urheberrechtsgesetz - Open Access Veröffentlichung von Zeitschriftenartikeln

38 Absatz 4: Der Urheber eines wissenschaftlichen Beitrags, der im Rahmen einer mindestens zur Hälfte mit öffentlichen Mitteln geförderten Forschungstätigkeit entstanden und in einer periodisch mindestens zweimal jährlich erscheinenden Sammlung erschienen ist, hat auch dann, wenn er dem Verleger oder Herausgeber ein ausschließliches Nutzungsrecht eingeräumt hat, das Recht, den Beitrag nach Ablauf von zwölf Monaten seit der Erstveröffentlichung in der akzeptierten Manuskriptversion öffentlich zugänglich zu machen, soweit dies keinem gewerblichen Zweck dient. Die Quelle der Erstveröffentlichung ist anzugeben. Eine zum Nachteil des Urhebers abweichende Vereinbarung ist unwirksam.

Es ist demnach nach Ablauf eines Jahres möglich, Zeitschriftenartikel z.B. im instutionellen Repositorium der JGU (Gutenberg Open) zu veröffentlichen. Dies ist z.B. relevant für die Erfüllung der Open Access Verpflichtung in Horizon 2020 Projekten.

 

SHERPA/RoMEO

Die Webseite SHERPA/RoMEO http://www.sherpa.ac.uk/romeo/index.php informiert zu Copyright Regelungen und Selbstarchivierungsvorgaben der verschiedensten wissenschaftlichen Verlage/Journale.

 

Creative Commons Lizenzen (CC-Lizenzen)

CC-Lizenzen https://de.creativecommons.org/ sind standardisierte Lizenzverträge mit deren Hilfe Urheber ihre digitalen Objekte in verschiedenen Graden zur Nutzung freigeben können. Im wissenschaftlichen Bereich ist die Verwendung von CC BY gebräuchlich.

Beispiele:

CC 0: Keine Rechte vorbehalten

CC BY: Namensnennung

CC BY SA: Namensnennung-Share Alike

CC BY ND: Namensnennung – Keine Bearbeitungen

 

Open-source-software

Informationen zu Open-Source-Software sowie eine Handreichung für die JGU zur Lizensierung von Software unter Open-Source-Lizenzen finden sich unter http://www.uni-mainz.de/forschung/Dateien/Open_Source_Lizenzen.pdf.

Im Umgang mit personenbezogenen Daten, z.B. im Rahmen von Interviews/Befragungen etc. sind das Bundes- und das Landesdatenschutzgesetz sowie die europäische Datenschutz-Grundverordnung zu berücksichtigen. https://eu-datenschutz.org/

Bei Fragen zum Datenschutz nehmen Sie bitte Kontakt zu den für Sie zuständigen Datenschutzbeauftragten auf. Für die JGU finden Sie diese unter www.verwaltung.zentrale-dienste.uni-mainz.de/29.php .

 

 

Vorträge

 

Aktionstag Forschungsdaten am 13. Juni 2018

"Vorstellung des Kompetenzteams Forschungsdaten"; Dr. Anne Vieten

"Wer, wie, was, warum? Fragen und Antworten rund um den Einstieg in das Forschungsdatenmanagement"; Dr. Jonas Recker

Von Forschungsdaten zu Projekten; Aline Deicke

"Wer sammelt Forschungsdaten? Das passende Repositorium mit re3data finden"; Frank Tristram