Namen, Verwechslungen und ORCID – Wie erreiche ich Eindeutigkeit in der Wissenschaft?

Namen identifizieren Personen. Im Alltag klappt das meistens sehr gut. Wir wissen aus dem Kontext und den Personenbeziehungen, von welchem Michael man genau spricht. Besteht ein solcher Zusammenhang jedoch nicht, wird es teilweise schwierig zu erkennen, wer genau eigentlich gemeint ist. Sprechen wir von der gleichen Person oder gibt es mehrere Personen mit dem gleichen Namen?

Nicht nur Alexander Schmidt, Sarah Müller und Martin Maier fragen sich dies. Auch eine Änderung des Namens oder die Latinisierung eines ausländischen Namens kann dazu führen, dass sich mehrere Namen eine einzigen Person zuordnen lassen. Beispielsweise lassen sich die georgischen Nachnahmensendungen „შვილი“ mit lateinischen Buchstaben etwa in -schwili, -shwili, -schvili und wahlweise -shvili übertragen. Im deutschen Sprachraum ist die erste Variante gebräuchlich, im Englisch die Letztere. Trotz unterschiedlicher Schreibweise kann die gleiche Person gemeint sein. Umlaute und ,ß‘ wäre weitere Beispiele für eine Veränderung der Schreibweise, die einen Namen unfreiwillig abwandeln können. So wird schnell aus Müller ein Mueller oder sogar Muller. Datenbanken können dabei häufig nicht erkennen, ob sich eine oder mehrere Personen dahinter verbergen.

Aber wieso ist dieses Problem überhaupt gravierend? Eine der zentralen Schwierigkeiten bei Datenbanken zu Personen, Literatur, Objekten und Institutionen ist die Eindeutigkeit bzw. Entität von Daten. Daher wird stets versucht etwa Doubletten zu vermeiden. Dabei behilft man sich mit sogenannten Wortnetzen bzw. Thesauren, um ein bestimmtes Objekt eindeutig zu benennen. Der „Art & Architecture Thesaurus® Online“ (kurz AAT)  des Getty Research Institute oder die Gemeinsame Normdatei für Personen (kurz GND) der Deutschen Nationalbibliothek sind etwa zwei zentrale kontrollierte Vokabulare, die in den Geisteswissenschaften häufig zur Anwendung kommen.
Besonders für Institutionen wie etwa die Max-Planck-Gesellschaft, ist es aus mehreren Gründen wichtig, dass die vielen verschiedenen Forschungspublikationen ihrer Mitarbeiter/-innen auch der eigenen Organisation zugeordnet werden können. Denn in der MPG arbeiten auch Wissenschaftler/innen, die etwa ebenso an Hochschulen lehren und forschen. Mehrere berufliche Anbindungen oder gar einen Arbeitsplatzwechsel können somit dazu führen, dass sich hinter mehreren Datenbankeinträgen eine einzige Person verbirgt. Daher benutzt die Max-Planck-Digital-Library für das MPG-eigene Repository „MPG.PuRe“ mit CoNE einen eignen Service für ein kontrolliertes Vokabular. Aus institutioneller Perspektive wie Bibliotheken, Archiven und Museen ist dies eine etablierte Möglichkeit die Entität vieler Daten zu erreichen.

Seit einigen Jahren existiert aber noch ein weiterer bzw. ergänzender Weg. So bieten verschiedene große Wissenschaftsverlage sogenannte Autorenidentifikationsnummer an, um über einen standardisierten Identifikator dem Autoren genau eine Entität zuschreiben zu können. Spätestens mit dem Aufkommen von sozialen Medien und der digitalen Vernetzung im akademischen Bereich – wie etwa Academia.edu und ResearchGate – war es wohl naheliegend, die Pflege des Autorenidentifikationsnummer und das Ergänzen von weiteren Informationen dem Autor selbst teilweise zu überlassen. Bei dieser neuen Möglichkeit dominieren bisher aber vor allem kommerzielle Anbieter, was Schwierigkeiten aufwerfen kann; es sei an dieser Stelle nur an die Hintergründe des DEAL-Projekts erinnert. 

ORCID®

Seit 2012 gibt mit der sogenannten „Open Researcher and Contributor ID“ (kurz ORCID) ein Code, der von einer Non-Profi-Organisation getragen wird. Große internationale Forschungsinstitution, viele Universitäten und etliche Wissenschaftsverlage haben sich darin zusammengefunden und einen numerischen Code zur eindeutigen Identifizierung von Wissenschaftlern entwickelt. Diese sechzehnstellige Zahl soll dabei zu einem Quasi-Standard für die Autorenidentifikation ausgebaut werden. In der Bundesrepublik sind etwa die Deutsche Nationalbibliothek, die Fraunhofer-Gesellschaft, die Georg-August-Universität Göttingen und die TU München Mitglieder von ORCID.

Durch diesen wissenschaftlichen Standard und die vielen, internationalen Institutionen, welche dahinter stehen, kann die ORCID vermutlich in der Zukunft für wissenschaftliche Publikationen zu einem wesentlichen Metadatenelement werden. So routiniert wie die Emailadressen wird dann vielleicht auch die sechszehnstellige, eigene ORCID mit angegeben. Über Schnittstellen könnte dann beispielsweise ein Plugin die Autorenbibliographie auf einer Universitätsseite oder einer eigenen Homepage automatisch generieren, aktualisieren und mit weiteren Verknüpfungen versorgen. Ebenso könnten Forschungsdaten und Publikationen eindeutig miteinander verbunden werden. Da ich als Autor die ORCID selbst pflegen kann, keine kommerzielle Absicht dahinter steht und die Langfristigkeit geben ist, hat mich dieser Service sehr überzeugt. Ab jetzt bin ich auch unter 0000-0002-2880-8947 (bzw. https://orcid.org/0000-0002-2880-8947) erreichbar.