Publikation und Archivierung von Daten
Vorteile von Datenpublikationen
Datenpublikationen machen Forschungsdaten auffindbar und nutzbar. Sie fördern die Nachvollziehbarkeit von Forschung. Die Daten werden dafür bei einem öffentlichen Repositorium eingereicht, erhalten in der Regel einen DOI und können dann wie Artikel zitiert werden. Die Vorteile von Datenpublikationen sind:
- Erhöhen die Sichtbarkeit und den wissenschaftlichen Impact.
- Werden in manchen Fachdisziplinen bereits als eigenständige wissenschaftliche Leistung anerkannt.
- Unterstützen Open Science und beschleunigen den Gesamtfortschritt der Wissenschaft.
Checkliste für das Publizieren von Daten
- Die Daten sind eindeutig benannt und die Identifier enthalten keine Sonderzeichen.
- Das Datenformat entspricht dem vom ausgewählten Repositorium geforderten Format.
- Alle für das Repositorium erforderlichen Metadaten wurden erfasst.
- Den Daten sind ausreichend Informationen beigefügt, um Datenqualität und Einhaltung disziplinärer Standards zu beurteilen.
- Es wurde eine geeignete Lizenz gewählt.
Hinweis
Bisher werden Forschungsdaten oft nur als "Supplementary Material" veröffentlicht. Dafür werden die Daten an den Verlag abgegeben, ohne einen eigenen, dauerhaften Identifier zu erhalten. Dieser Ansatz ist problematisch, da er eine langfristige Archivierung und die Einhaltung der FAIR-Prinzipien verhindert!
Allgemeine und fachspezifische Repositorien
Öffentliche Repositorien sichern Forschungsdaten langfristig mit Fokus auf Zugänglichkeit und Wiederverwendbarkeit der Daten gemäß den FAIR-Prinzipien. Neben allgemeinen Repositorien, wie z. B. Zenodo, die alle Datentypen und generische Metadaten akzeptieren, gibt es auch fachspezifische Repositorien, die nur bestimmte Datentypen in validierten Datenformaten und detaillierte, fachspezifische Metadaten zulassen. Dadurch sind Datenstrukturen und Suchfunktionen optimal auf den jeweiligen Datentyp abgestimmt und die Einhaltung von Community‑Standards sichert die Datenqualität.
Beispiele spezialisierter Repositorien im Fachgebiet der Biologie sind:
- Mikroskopiedaten: BioImage Archive, IDR, OMERO.public
- Sequenzdaten: ENA, NCBI SRA, DDBJ
- Proteomdaten: PRIDE
- Metabolomdaten: MetaboLights, EMBL-EBI Metabolights
- Massenspektrometriedaten: GNPS, MassIVE
- Strukturdaten: PDB
Repositorien-Übersicht
Repositorien-Datenbanken mit Filterfunktion:
Das FDM-Team unterstützt Sie gerne bei der Suche nach einem passenden Repositorium für Ihre Daten.
Vorgehensweise beim Finden eines passenden Repositoriums
- Daten-/Fachgebiet klären: Ordnen Sie den Datentyp ein (z. B. Sequenzen, Bilder, Omics, Protokolle, ...).
- Passende Repositorien recherchieren: Nutzen Sie z. B. die Datenbank re3data oder FAIRsharing mit passenden Stichwörtern.
- Journal-/Fördereranforderungen prüfen: Manche Verlage oder Geldgeber schreiben bestimmte Repositorien vor!
- Community-Standards beachten: Viele Fachcommunities haben bevorzugte Repositorien.
- Zusätzliche Anforderungen prüfen: Z. B. Zugriffsrechte, Datenschutz, DOI-Vergabe, Standort, Formate, Datengröße, Datenstrukturierung, Metadaten oder Lizenzierung.
Überblick ausgewählter Repositorien
| Name | Empfohlene Nutzung | Interaktivität | Max. Uploadgröße | Download | Visualisierung | Zuständigkeit | |
|---|---|---|---|---|---|---|---|
| OMERO.public | Biologische Bildgebungsdaten | ✅ | ✅ | keine Beschränkung | ✅ | ✅ | Biology UOS |
| osnaData | Alle Formate | ✅ | ❌ | keine Beschränkung | ✅ | ❌ | UOS Library |
| Zenodo | Alle Formate | ✅ | ❌ | 50 GB | ✅ | ❌ | CERN |
| IDR | Biologische Bildgebungsdaten | ❌ | ✅ | keine Beschränkung | ✅ | ✅ | OME team |
| Bioimage Archive | Biologische Bildgebungsdaten | ✅ | ✅ | keine Beschränkung | ✅ | ✅ | EMBL-EBI |
| Figshare | Alle Formate | ✅ | ❌ | 20 GB kostenlos (mehr bei kostenpflichtiger Nutzung) | ✅ | ✅ | Figshare team |
Die Fachgruppe Biologie bietet seinen Mitarbeitenden die kostenlose Software OMERO für das Management von Bilddaten an. In seiner Funktion als Repositorium ermöglicht OMERO auch das Publizieren von Bilddaten. Dabei erhalten alle Bilddaten einen persistenten Identifier und können so in wissenschaftlichen Artikeln zitiert werden.
Sie benötigen Hilfe? Das FDM-Team unterstützt Sie gerne beim Publizieren Ihrer Bilddaten, vom Erstellen einer OMERO-Gruppe bis hin zum Beantragen einer Daten-DOI.
Schauen Sie sich gerne ein Beispiel einer Datenpublikation an oder besuchen Sie die CellNanOs OMERO Gallery mit aktuellen Publikationen des Fachbereichs.
Vorgehensweise
- Beantragen einer OMERO-Gruppe für Ihre Daten-Publikation
- Hinterlegen der Daten in OMERO
- Hinterlegen der Metadaten in OMERO
- Beantragen einer Daten-DOI
Für mehr Informationen kontaktieren Sie bitte Dr. Susanne Kunis.
Projektergebnisse, die aus DFG-geförderten Projekten resultieren, müssen der Öffentlichkeit in geeigneter Weise zugänglich gemacht werden. Publikationen müssen den folgenden Hinweis auf die DFG-Förderung enthalten:
Gefördert durch die Deutsche Forschungsgemeinschaft (DFG) - Projektnummer(n)
oder
Funded by the Deutsche Forschungsgemeinschaft (DFG, German Research Foundation) – Projektnummer(n)
Bezieht sich eine Veröffentlichung auf mehrere Projekte, müssen die Projektnummern durch Semikolon getrennt werden.
DFG-Projektnummer
Die DFG-Projektnummer des referenzierten Projekts ist im Bewilligungsschreiben oder im DFG-Projektinformationssystem GEPRIS zu finden.
Wie man sich für eine Lizenz entscheidet und Überblicke finden Sie unter:
- Informationen über gängige Open-Source-Lizenzen
- Generiere personalisierte Lizenz-Codes wie z. B. in:
Structuring of Data and Metadata in Bioimaging: Concepts and technical Solutions in the Context of Linked Data © 2022 by Kunis is licensed under CC BY 4.0
- Überblick, wie man Creative-Commons-Bilder kennzeichnet
Infos der Universität Osnabrück
Eine Archivierung von Forschungsdaten soll im besten Fall die langfristige Verfügbarkeit und Nachvollziehbarkeit sowie auch eine Nachnutzung dieser Daten ermöglichen. Für eine Langzeitarchivierung gemäß den FAIR-Prinzipien sollten die Dateien daher:
- unverschlüsselt sein
- nicht komprimiert werden
- nicht firmeneigen/patentiert sein
- einen offenen, dokumentierten Standard bzgl. Datenformat und Metadaten nutzen
- klar beschrieben sein
Als Speicherort nutzen Sie bitte die von der Universität Osnabrück bereitgestellte Infrastruktur bzw. immer nur anerkannte nationale oder internationale (fachspezifische) Repositorien oder Archive.
Entscheidend ist auch, dass abschließend festgelegt und öffentlich zugänglich beschrieben wird (z. B. in einer Publikation), wie der Zugriff auf die archivierten Daten erfolgt.
Infos der Universität Osnabrück
Archiv oder Repositorium?
Wissenschaftliche Archive bewahren Daten langfristig und schützen ihre Authentizität durch beschränkten Zugriff. Repositorien speichern Daten mit dem Ziel, langfristige Zugänglichkeit und Wiederverwendbarkeit zu ermöglichen, gemäß den FAIR-Prinzipien. Beide können sich überschneiden, aber nicht jedes Repositorium ist ein vollständiges Archiv.