Geisteswissenschaftliche Forschungsdaten – Was ist das und was mache ich konkret damit?

Was sind eigentlich geisteswissenschaftliche Forschungsdaten? Forschungsdaten sind sehr allgemein alle Ergebnisse, die zwischen dem Studium der Primärdaten (zeitgenössische Literatur, Archivquellen, Gegenstände, Ausgrabungen) und der Veröffentlichung der gewonnenen Erkenntnisse (etwa als Buch oder in einem Aufsatz) liegen. Die virtuelle Fachbibliothek Osteuropa der Bayerischen Staatsbibliothek zeigt diesen Zwischenbereich von Forschung – zwischen Wissensgenerierung und -veröffentlichung – recht anschaulich in einer Pyramidengraphik. Solche Aspekte des Forschungsdatenmanagement – kurz FDM – werden meiner Meinung nach in Zukunft für die wissenschaftliche Forschung zunehmend wichtiger werden. Die Leitlinien der DFG zum Umgang mit Forschungsdaten und auch Empfehlungen des BMBF zum Umgang mit Forschungsdaten zeigen schon deutlich in diese Richtung. Für die aktuelle Diskussion zu einer nationalen Forschungsdateninfrastruktur siehe besonders den Twitter-Hashtag #finfra18.

Was sind die Forschungsdaten konkret, mit denen man als Wissenschaftler/-innen arbeitet? So unterschiedlich die Projekte im Bereich der Geisteswissenschaften sind, Arbeitsbibliographien entstehen zum Beispiel bei nahezu allen Themen. Für meine Dissertation habe ich letztlich ca. 3.800 Primärliteratureinträge – also für Veröffentlichungen vor 1991 – zusammengetragen. Hiervon habe ich nur knapp die Hälfte in der Fakultäts- bzw. Verlagsfassung verwendet und in dem Literaturverzeichnis aufgelistet.

Was passiert aber mit der anderen Hälfte? In der Dissertationsveröffentlichung erscheinen sie jedoch nicht. Eigentlich wäre daher die Mühe, viele entlegene Zeitungsartikel und Magazinbeiträge bibliographisch aufzunehmen, vergeblich gewesen. Die von mir zusammengetragenen Daten wären eventuell langfristig verloren gegangen, wenn ich sie nicht mehr aufgreifen sollte. Für die anderen Kolleg/-innen wären sie dann nicht frei zugänglich. Eine veröffentlichte Arbeitsbibliographie kann dies ermöglich.

Hinzu kommt ein zweiter Aspekt, nämlich die Transparenz. Denn es kann für die Forscher/-innen aus benachbarten Bereichen genauso interessant sein, welche Primärquellen ich in meiner Arbeit nicht verwende. Für sie ist nämlich durch die Bibliographie in meinem Buch nicht nachvollziehbar, auf welche designhistorische Literatur ich mich nicht gezogen habe.

Und drittens orientiere ich durch die freie Zugänglichkeit meiner Arbeitsbibliographie auch an der GO Fair Initiative (siehe hier und hier) der Europäischen Kommission. Durch die Interoperabilität – die Verarbeitbarkeit von Daten – und die Wiederverwendbarkeit von Daten ermögliche ich es zukünftigen Forscher/-innen, die sich etwa mit der Geschichte des bundesdeutschen Industriedesigns beschäftigen, dass sie meine Arbeitsbibliographie zu der Primärliteratur als einen Ausgangspunkt ihrer Projekte hinzuziehen können. So ist es möglich, dass sie etwa auf historische Zeitungs- und Magazinartikel zurückgreifen, die bis dahin nicht rezipiert worden waren.

Symbolbild: Technische Daten eines LINT der NordWestBahn, photographiert von F1 absolutely am 09.05.2010, freie Nutzung uneingeschränkt erlaubt

Mein Dissertationsprojekt habe ich lang mit diesem Blog begleitet. Er bildet daher auch den Kontext meiner Forschungstätigkeit ab, da ich hier auch über Konferenz- und Archivbesuche geschrieben oder erste Zwischenergebnisse formuliert habe, die ich später in der Dissertationsveröffentlichung wieder aufgenommen habe. Es ist daher konsequent, wenn ich die vergangenen Textbeiträge ebenfalls archiviere und zugänglich mache.

Sowohl im Blog als auch bei der Arbeitsbibliographie gibt es keine rechtlichen Probleme mit der Veröffentlichung, da ich der Urheber bin und etwa über das Forschungsprojekt kein Repository vorgegeben war. Die Seite www.forschungsdaten.info beschreibt jedoch sehr gut die verschiedenen, rechtlichen Aspekte die bei Forschungsdaten beachtet werden müssen. Dies wird etwa bei Archivphotographien oder Zeitzeug/-innen-Interview relevant.

Offen bleibt dabei jedoch, welche Daten nun wirklich veröffentlich werden. Wie es beispielsweise auf dem DHMuc-Blog thematisiert wird, habe auch ich mich gegen die Weitergabe von Notizen, persönlichen Schlagwörtern usw. entschieden. Ich „beschränke“ mich daher auf die bibliographischen Daten.

Aber wie mache ich nun meine Forschungsdaten zugänglich und archiviere sie? Ich habe mich mit Open Data LMU der LMU-Universitätsbibliothek für ein institutionelles Repository entschieden. Da ich die Arbeit an der Ludwig-Maximilians-Universität München verfasst habe, lag es nahe auch die Forschungsdaten dort zugänglich zu machen. Zugleich kann ich mit der Universitätsbibliothek sicher sein, dass die Daten dort langfristig bereitgestellt werden. Eine andere Möglichkeit wäre etwa das DARIAH-DE-Repository gewesen. Weitere Möglichkeit hätte man etwa über DataCite recherchieren können.

Aber welche Datenformate eigenen sich für die Langzeitarchivierung von Forschungsdaten? Die ViFa Osteuropa gibt eine gute Handreichung zu den empfohlen Dateiformate, in welchen die Forschungsdaten gespeichert werden sollten. Für den Blog habe ich ein WordPress-Tool verwendet, dass alle Blogposts im xml-Format ausgibt. Die Arbeitsbibliographie habe ich in verschiedenen Versionen erstellt, um eine möglichst große Bandbreite anzubieten und die Nachnutzung zu vereinfachen. Ich habe mich für die drei Dateiformate -html, -txt und pdf (PDF/A-3) entschieden. Als Ausgabestil habe ich wiederum einen BibTeX-Export, einen RefMan-RIS-Export und menschenlesbare Bibliographievariante gewählt.

Meine Arbeitsbibliographie und mein Forschungsblog sind nun veröffentlicht und archiviert. Sie sind auf dem Open Data LMU-Server unter der DOI https://doi.org/10.5282/ubm/data.122 und https://doi.org/10.5282/ubm/data.123 zu finden. Über Feedback, Anmerkungen und Verbesserungsvorschläge würde ich mich freuen.

Advertisements