Publikation und Archivierung von Daten

Vorteile von Datenpublikationen

Datenpublikationen machen Forschungsdaten auffindbar und nutzbar. Sie fördern die Nachvollziehbarkeit von Forschung. Die Daten werden dafür bei einem  öffentlichen Repositorium eingereicht, erhalten in der Regel einen DOI und können dann wie Artikel zitiert werden. Die Vorteile von Datenpublikationen sind:

  • Erhöhen die Sichtbarkeit und den wissenschaftlichen Impact.
  • Werden in manchen Fachdisziplinen bereits als eigenständige wissenschaftliche Leistung anerkannt.
  • Unterstützen Open Science und beschleunigen den Gesamtfortschritt der Wissenschaft.

 

Checkliste für das Publizieren von Daten
  1. Die Daten sind eindeutig benannt und die Identifier enthalten keine Sonderzeichen.
  2. Das  Datenformat entspricht dem vom ausgewählten Repositorium geforderten Format.
  3. Alle für das Repositorium erforderlichen  Metadaten wurden erfasst.
  4. Den Daten sind ausreichend Informationen beigefügt, um Datenqualität und Einhaltung disziplinärer Standards zu beurteilen.
  5. Es wurde eine  geeignete Lizenz gewählt.

Hinweis

Bisher werden Forschungsdaten oft nur als "Supplementary Material" veröffentlicht. Dafür werden die Daten an den Verlag abgegeben, ohne einen eigenen, dauerhaften Identifier zu erhalten. Dieser Ansatz ist problematisch, da er eine langfristige Archivierung und die Einhaltung der  FAIR-Prinzipien verhindert!

Allgemeine und fachspezifische Repositorien

Öffentliche Repositorien sichern Forschungsdaten langfristig mit Fokus auf Zugänglichkeit und Wiederverwendbarkeit der Daten gemäß den  FAIR-Prinzipien.

Neben allgemeinen Repositorien, die alle Datentypen und generische Metadaten akzeptieren, wie z.B. Zenodo, gibt es auch fachspezifische Repositorien, die nur bestimmte Datentypen in validierten Datenformaten und detaillierte, fachspezifische Metadaten akzeptieren, um eine präzise Beschreibung und Analyse der Daten innerhalb des Fachgebiets zu ermöglichen. Datenstrukturen und Suchfunktionen sind hier optimal auf den jeweiligen Datentyp abgestimmt. Die Einhaltung von Community-Standards gewährleistet zudem die Qualität der Forschungsdaten.

Beispiele spezialisierter Repositorien im Fachgebiet der Biologie sind:

  • Sequenzdaten: ENA, NCBI SRA, DDBJ
  • Proteomdaten: PRIDE
  • Metabolomdaten: MetaboLights, EMBL-EBI Metabolights
  • Massenspektrometriedaten: GNPS, MassIVE
  • Strukturdaten: PDB

Für biologische Bildgebungsdaten finden Sie nachkommend eine kleine Übersicht ausgewählter Repositorien.

Repositorien-Übersicht

Repositorien-Datenbanken mit Filterfunktion:

 re3data

 FAIRsharing


 Öffentliche Repositorien für Bilddaten (PNG) (2024)

Das  FDM-Team unterstützt Sie gerne bei der Suche nach einem passenden Repositorium für Ihre Daten.

Data Publishing Databases
Überblick ausgewählter Repositorien
Name Empfohlene Nutzung drawing Interaktivität Max. Uploadgröße Download Visualisierung Zuständigkeit
OMERO.public Biologische Bildgebungsdaten keine Beschränkung Biology UOS
osnaData Alle Formate keine Beschränkung UOS Library
Zenodo Alle Formate 50 GB CERN
IDR Biologische Bildgebungsdaten keine Beschränkung OME team
Bioimage Archive Biologische Bildgebungsdaten keine Beschränkung EMBL-EBI
Figshare Alle Formate 20 GB kostenlos (mehr bei kostenpflichtiger Nutzung) Figshare team
Vorgehensweise beim Finden eines passenden Repositoriums
  1. Daten-/Fachgebiet klären: Ordnen Sie den Datentyp ein (z.B. Sequenzen, Bilder, Omics, Protokolle, ...).
  2. Passende Repositorien recherchieren: Nutzen Sie z. B.  re3data oder  FAIRsharing mit passenden Stichwörtern.
  3. Journal-/Fördereranforderungen prüfen: Manche Verlage oder Geldgeber schreiben bestimmte Repositorien vor!
  4. Community-Standards beachten: Viele Fachcommunities haben bevorzugte Repositorien.
  5. Zusätzliche Anforderungen prüfen: Z.B. Zugriffsrechte, Datenschutz, DOI-Vergabe, Standort, Formate, Datengröße, Datenstrukturierung, Metadaten oder Lizenzierung.

Die Fachgruppe Biologie bietet seinen Mitarbeitenden die kostenlose Software  OMERO für das Management von Bilddaten an. OMERO verwaltet und archiviert Bilddaten in über 150 verschiedenen Formaten auf einem zentralen, sicheren Bildserver mit einer Datenbank für Metadaten.

In seiner Funktion als  Repositorium ermöglicht OMERO auch das  Publizieren von Bilddaten. Dabei erhalten alle Bilddaten einen persistente Identifier und können in wissenschaftlichen Artikeln zitiert werden.

Schauen Sie sich gerne ein  Beispiel einer Datenpublikation an.

Vorgehensweise

  1. Beantragen einer OMERO-Gruppe für Ihre Daten-Publikation
  2. Hinterlegen der Daten in OMERO
  3. Hinterlegen der Metadaten in OMERO
  4. Beantragen einer Daten-DOI

Für mehr Informationen bzw. bei einem konkreten Publikationsanliegen kontaktieren Sie bitte  Dr. Susanne Kunis.

Projektergebnisse, die aus DFG-geförderten Projekten resultieren, müssen der Öffentlichkeit in geeigneter Weise zugänglich gemacht werden. Publikationen müssen den folgenden Hinweis auf die DFG-Förderung enthalten:

Gefördert durch die Deutsche Forschungsgemeinschaft (DFG) - Projektnummer(n)

oder 

Funded by the Deutsche Forschungsgemeinschaft (DFG, German Research Foundation) – Projektnummer(n)

Bezieht sich eine Veröffentlichung auf mehrere Projekte, müssen die Projektnummern durch Semikolon getrennt werden.

DFG-Projektnummer

Die DFG-Projektnummer des referenzierten Projekts ist im Bewilligungsschreiben oder im DFG-Projektinformationssystem  GEPRIS zu finden.


 DFG Funding Acknownledgements

Eine Archivierung von Forschungsdaten soll im besten Fall die langfristige Verfügbarkeit und Nachvollziehbarkeit sowie auch eine Nachnutzung dieser Daten ermöglichen. Für eine Langzeitarchivierung gemäß den  FAIR-Prinzipien sollten die Dateien daher:

  • unverschlüsselt sein
  • nicht komprimiert werden
  • nicht firmeneigen/patentiert sein
  • einen offenen, dokumentierten Standard bzgl.  Datenformat und  Metadaten nutzen
  • klar beschrieben sein

Als  Speicherort nutzen Sie bitte die von der Universität Osnabrück bereitgestellte Infrastruktur bzw. immer nur anerkannte nationale oder internationale (fachspezifische)  Repositorien oder Archive.

Entscheidend ist auch, dass abschließend festgelegt und öffentlich zugänglich beschrieben wird (z.B. in einer Publikation), wie der Zugriff auf die archivierten Daten erfolgt.

Infos der Universität Osnabrück

Archiv oder Repositorium?

Wissenschaftliche Archive bewahren Daten langfristig und schützen ihre Authentizität durch beschränkten Zugriff. Repositorien speichern Daten mit dem Ziel, langfristige Zugänglichkeit und Wiederverwendbarkeit zu ermöglichen, gemäß den  FAIR-Prinzipien. Beide können sich überschneiden, aber nicht jedes Repositorium ist ein vollstängiges Archiv.