Publikation und Archivierung von Daten
Vorteile von Datenpublikationen
Datenpublikationen machen Forschungsdaten auffindbar und nutzbar. Sie fördern die Nachvollziehbarkeit von Forschung. Die Daten werden dafür bei einem öffentlichen Repositorium eingereicht, erhalten in der Regel einen DOI und können dann wie Artikel zitiert werden. Die Vorteile von Datenpublikationen sind:
- Erhöhen die Sichtbarkeit und den wissenschaftlichen Impact.
- Werden in manchen Fachdisziplinen bereits als eigenständige wissenschaftliche Leistung anerkannt.
- Unterstützen Open Science und beschleunigen den Gesamtfortschritt der Wissenschaft.
Checkliste für das Publizieren von Daten
- Die Daten sind eindeutig benannt und die Identifier enthalten keine Sonderzeichen.
- Das Datenformat entspricht dem vom ausgewählten Repositorium geforderten Format.
- Alle für das Repositorium erforderlichen Metadaten wurden erfasst.
- Den Daten sind ausreichend Informationen beigefügt, um Datenqualität und Einhaltung disziplinärer Standards zu beurteilen.
- Es wurde eine geeignete Lizenz gewählt.
Hinweis
Bisher werden Forschungsdaten oft nur als "Supplementary Material" veröffentlicht. Dafür werden die Daten an den Verlag abgegeben, ohne einen eigenen, dauerhaften Identifier zu erhalten. Dieser Ansatz ist problematisch, da er eine langfristige Archivierung und die Einhaltung der FAIR-Prinzipien verhindert!
Allgemeine und fachspezifische Repositorien
Öffentliche Repositorien sichern Forschungsdaten langfristig mit Fokus auf Zugänglichkeit und Wiederverwendbarkeit der Daten gemäß den FAIR-Prinzipien.
Neben allgemeinen Repositorien, die alle Datentypen und generische Metadaten akzeptieren, wie z.B. Zenodo, gibt es auch fachspezifische Repositorien, die nur bestimmte Datentypen in validierten Datenformaten und detaillierte, fachspezifische Metadaten akzeptieren, um eine präzise Beschreibung und Analyse der Daten innerhalb des Fachgebiets zu ermöglichen. Datenstrukturen und Suchfunktionen sind hier optimal auf den jeweiligen Datentyp abgestimmt. Die Einhaltung von Community-Standards gewährleistet zudem die Qualität der Forschungsdaten.
Beispiele spezialisierter Repositorien im Fachgebiet der Biologie sind:
- Sequenzdaten: ENA, NCBI SRA, DDBJ
- Proteomdaten: PRIDE
- Metabolomdaten: MetaboLights, EMBL-EBI Metabolights
- Massenspektrometriedaten: GNPS, MassIVE
- Strukturdaten: PDB
Für biologische Bildgebungsdaten finden Sie nachkommend eine kleine Übersicht ausgewählter Repositorien.
Repositorien-Übersicht
Repositorien-Datenbanken mit Filterfunktion:
Das FDM-Team unterstützt Sie gerne bei der Suche nach einem passenden Repositorium für Ihre Daten.
Überblick ausgewählter Repositorien
| Name | Empfohlene Nutzung | Interaktivität | Max. Uploadgröße | Download | Visualisierung | Zuständigkeit | |
|---|---|---|---|---|---|---|---|
| OMERO.public | Biologische Bildgebungsdaten | ✅ | ✅ | keine Beschränkung | ✅ | ✅ | Biology UOS |
| osnaData | Alle Formate | ✅ | ❌ | keine Beschränkung | ✅ | ❌ | UOS Library |
| Zenodo | Alle Formate | ✅ | ❌ | 50 GB | ✅ | ❌ | CERN |
| IDR | Biologische Bildgebungsdaten | ❌ | ✅ | keine Beschränkung | ✅ | ✅ | OME team |
| Bioimage Archive | Biologische Bildgebungsdaten | ✅ | ✅ | keine Beschränkung | ✅ | ✅ | EMBL-EBI |
| Figshare | Alle Formate | ✅ | ❌ | 20 GB kostenlos (mehr bei kostenpflichtiger Nutzung) | ✅ | ✅ | Figshare team |
Vorgehensweise beim Finden eines passenden Repositoriums
- Daten-/Fachgebiet klären: Ordnen Sie den Datentyp ein (z.B. Sequenzen, Bilder, Omics, Protokolle, ...).
- Passende Repositorien recherchieren: Nutzen Sie z. B. re3data oder FAIRsharing mit passenden Stichwörtern.
- Journal-/Fördereranforderungen prüfen: Manche Verlage oder Geldgeber schreiben bestimmte Repositorien vor!
- Community-Standards beachten: Viele Fachcommunities haben bevorzugte Repositorien.
- Zusätzliche Anforderungen prüfen: Z.B. Zugriffsrechte, Datenschutz, DOI-Vergabe, Standort, Formate, Datengröße, Datenstrukturierung, Metadaten oder Lizenzierung.
Die Fachgruppe Biologie bietet seinen Mitarbeitenden die kostenlose Software OMERO für das Management von Bilddaten an. OMERO verwaltet und archiviert Bilddaten in über 150 verschiedenen Formaten auf einem zentralen, sicheren Bildserver mit einer Datenbank für Metadaten.
In seiner Funktion als Repositorium ermöglicht OMERO auch das Publizieren von Bilddaten. Dabei erhalten alle Bilddaten einen persistente Identifier und können in wissenschaftlichen Artikeln zitiert werden.
Schauen Sie sich gerne ein Beispiel einer Datenpublikation an.
Vorgehensweise
- Beantragen einer OMERO-Gruppe für Ihre Daten-Publikation
- Hinterlegen der Daten in OMERO
- Hinterlegen der Metadaten in OMERO
- Beantragen einer Daten-DOI
Für mehr Informationen bzw. bei einem konkreten Publikationsanliegen kontaktieren Sie bitte Dr. Susanne Kunis.
Projektergebnisse, die aus DFG-geförderten Projekten resultieren, müssen der Öffentlichkeit in geeigneter Weise zugänglich gemacht werden. Publikationen müssen den folgenden Hinweis auf die DFG-Förderung enthalten:
Gefördert durch die Deutsche Forschungsgemeinschaft (DFG) - Projektnummer(n)
oder
Funded by the Deutsche Forschungsgemeinschaft (DFG, German Research Foundation) – Projektnummer(n)
Bezieht sich eine Veröffentlichung auf mehrere Projekte, müssen die Projektnummern durch Semikolon getrennt werden.
DFG-Projektnummer
Die DFG-Projektnummer des referenzierten Projekts ist im Bewilligungsschreiben oder im DFG-Projektinformationssystem GEPRIS zu finden.
Wie man sich für eine Lizenz entscheidet und Überblicke finden Sie unter:
- Informationen über gängige Open-Source-Lizenzen
- Generiere personalisierte Lizenz-Codes wie z.B. in:
Structuring of Data and Metadata in Bioimaging: Concepts and technical Solutions in the Context of Linked Data © 2022 by Kunis is licensed under CC BY 4.0
- Überblick, wie man Creative-Commons-Bilder kennzeichnet
Infos der Universität Osnabrück
Eine Archivierung von Forschungsdaten soll im besten Fall die langfristige Verfügbarkeit und Nachvollziehbarkeit sowie auch eine Nachnutzung dieser Daten ermöglichen. Für eine Langzeitarchivierung gemäß den FAIR-Prinzipien sollten die Dateien daher:
- unverschlüsselt sein
- nicht komprimiert werden
- nicht firmeneigen/patentiert sein
- einen offenen, dokumentierten Standard bzgl. Datenformat und Metadaten nutzen
- klar beschrieben sein
Als Speicherort nutzen Sie bitte die von der Universität Osnabrück bereitgestellte Infrastruktur bzw. immer nur anerkannte nationale oder internationale (fachspezifische) Repositorien oder Archive.
Entscheidend ist auch, dass abschließend festgelegt und öffentlich zugänglich beschrieben wird (z.B. in einer Publikation), wie der Zugriff auf die archivierten Daten erfolgt.
Infos der Universität Osnabrück
Archiv oder Repositorium?
Wissenschaftliche Archive bewahren Daten langfristig und schützen ihre Authentizität durch beschränkten Zugriff. Repositorien speichern Daten mit dem Ziel, langfristige Zugänglichkeit und Wiederverwendbarkeit zu ermöglichen, gemäß den FAIR-Prinzipien. Beide können sich überschneiden, aber nicht jedes Repositorium ist ein vollstängiges Archiv.