Forschungsdaten richtig zitieren

Zitationspraktiken können zwischen Fachbereichen und Verlagen variieren. Informieren Sie sich daher bei Kollegen innerhalb ihres Fachbereichs, ihrem Verleger oder bei der Beratung zum wissenschaftlichen Arbeiten, welche Form der Zitation zu wählen ist.

Die folgende Empfehlung zur Datenzitation wurde von FORCE11 herausgegeben und dient der Orientierung. FORCE11 ist eine Community-Initiative im Bereich des Forschungsdatenmanagements, die unter anderem die Data Citation Principles entwickelt hat, um den Wandel des wissenschaftlichen Kommunikations- und Forschungsprozesses zu unterstützen.

FORCE11 Datenzitationsprinzipien (Data Citation Principles)

Die Data Citation Principles von FORCE11 umfassen den Zweck, die Funktion und Eigenschaften von Zitationen. Die Prinzipien gliedern sich nach Erleichterung des Verständnisses und sind nicht nach Wichtigkeit angeordnet.

  1. Bedeutung (Importance)

    Forschungsdaten sollten als legitime, zitierbare Produkte der Forschung angesehen werden. Datenzitationen sollten folglich die gleiche Bedeutung für die wissenschaftliche Laufbahn erfahren, wie die Zitation anderer Forschungsobjekte, wie beispielsweise Publikationen.

  2. Ansehen und Zuordnung (Credit and Attribution)

    Datenzitationen sollten die wissenschaftliche Anerkennung und normative, sowie legale Zuschreibung aller Mitwirkenden der Daten erleichtern, wobei anerkannt werden muss, dass ein einzelner Zuschreibungsstil oder -mechanismus nicht auf alle Datenformen anwendbar sein muss oder kann.

  3. Belege (Evidence)

    In wissenschaftlicher Literatur, sobald eine Behauptung auf Daten basiert, sollten die korrespondierenden Daten zitiert werden, um die Behauptung zu stützen.

  4. Eindeutige Identifizierung (Unique Identification)

    Eine Datenzitation sollte eine persistente Methode zur Identifikation beinhalten, welche maschinenlesbar, global eindeutig und weit verbreitet in der Community ist.

  5. Zugang (Access)

    Datenzitationen sollten den Zugang zu den Daten selbst und zu den dazugehörigen Metadaten, Dokumentationen und anderen Materialen, wie bspw. Quellcodes, erleichtern, die sowohl für Menschen als auch Maschinen notwendig sind um einen informierten Nutzen aus den referenzierten Daten zu ziehen.

  6. Beständigkeit (Persistence)

    Eindeutige Identifikatoren (Persistent Identifier) und Metadaten, die die Daten beschreiben, sowie deren Verfügbarkeit, sollten langfristig verfügbar sein - sogar über die Lebensspanne der Daten, die sie beschreiben, hinaus.

  7. Genauigkeit und Nachprüfbarkeit (Specificity and Verifiability)

    Datenzitationen sollten die Identifikation der Zugänge und die Überprüfbarkeit von bestimmten Daten erleichtern, die eine Behauptung belegen. Zitationen oder Zitationsmetadaten sollten ausreichende Informationen über Herkunft und Beständigkeit enthalten, um so die Verifizierung einer bestimmten Zeitspanne, Version und/oder eines granularen Abschnitts der nachfolgend abgerufenen Daten zu erleichtern. So kann geprüft werden, ob es sich um die originär zitierten Daten handelt.

  8. Interoperabilität and Flexibilität (Interoperability and Flexibility)

    Methoden zur Datenzitation sollten ausreichend flexibel sein und sich an die verschiedenen Praktiken der Communities anpassen. Sie sollten aber auch nicht so sehr abweichen, dass die Interoperabilität der Datenzitation zwischen Communities gefährdet wird.

Siehe auch die FORCE11-Seite von forschungsdaten.org.

Formate für Datenzitationen:

DataCite Citation Formatter

Der DOI Citation Formatter mitentwickelt von DataCite (u. a. eine DOI-Registrierungsagentur für Forschungsdaten) bietet die Möglichkeit einen DOI-Persistent Identifier zu übergeben, um als Antwort eine vollständige Zitationsangabe für einen mit einer DOI-versehenen Datensatz zu erhalten.

APA

Die APA bietet auf ihrer Webseite eine Beispielzitation für einen Forschungsdatensatz an.

U.S. Department of Health and Human Services, Substance Abuse and Mental Health Services Administration, Office of Applied Studies. (2013). Treatment episode data set -- discharges (TEDS-D) -- concatenated, 2006 to 2009 [Data set]. doi:10.3886/ICPSR30122.v2