Umfrage: Forschungsdaten in den Orientwissenschaften

Konzept

Forschungsdaten bilden eine wesentliche Grundlage für das wissenschaftliche Arbeiten. Wenn Ihre Forschungsergebnisse auf Daten basieren, die nicht mehr verfügbar sind oder die nur auf Ihren Speichermedien ruhen, sollten Sie sich für das Thema interessieren.

Für die Nachvollziehbarkeit und Qualität einer wissenschaftlichen Arbeit sowie für die Nachnutzung für andere Projekte, sollten Forschungsdaten aufbereitet und langfristig zur Verfügung gestellt werden. Hier spielen nicht nur wissenschaftliche, sondern auch juristische, technische und finanzielle Aspekte eine Rolle.

 

Deshalb ruft die DFG Wissenschaftlerinnen und Wissenschaftler aller Fachrichtungen dazu auf, bereits bei der Projektplanung und Antragstellung ein Konzept für den angemessenen Umgang mit Forschungsdaten zu erarbeiten.

 

Als Infrastrukturprojekt der DFG möchten wir vom Fachinformationsdienst Nahost unsere Fachcommunity beim Forschungsdatenmanagement unterstützen. Dafür würden wir gerne wissen, welche Daten im orientwissenschaftlichen Kontext anfallen, was deren Besonderheiten sind und wie derzeit damit umgegangen wird.

 

Vor dem Hintergrund der sich etablierenden Nationale Forschungsdateninfrastruktur (NFDI) sind die Orientwissenschaften zunehmend gefordert, auf die Spezifika ihrer Forschungsdaten hinzuweisen, bevor die technischen Rahmenbedingungen von benachbarten Disziplinen ohne Erfahrungswerte mit orientwissenschaftlichen Besonderheiten festgeschrieben werden. Der FID Nahost möchte hier einen Dialog mit seiner Community initiieren und lädt Sie dazu ein, mit Ihrer Expertise daran teilzuhaben.

Ergebnisse der Umfrage

Hier finden Sie die Auswertung unserer 2018 durchgeführten Umfrage zur Nutzung von Forschungsdaten in den orientwissenschaftlichen Fächern.

Wir bedanken uns bei allen Teilnehmern. Es lässt sich eine solide Basis für ein funktionierendes Forschungsdatenmanagement schaffen.

 

Im Folgenden werden die Antworten auf die einzelnen Fragen ausgewertet und dargestellt, welche Folgen diese für weitere Vorgehensweisen haben.

Die erste Frage richtete sich an die Forschungsgrundlagen, die im Fachbereich zugrunde gelegt werden. Wie zu erwarten war, stützte sich ein großer Teil der Forschung auf nichtlateinische Literatur, Handschriften und anderes Textmaterial. Aber auch Websites und Fotos wurden als wichtige Quellen genannt.

 

Die Unterstützung mit nichtwestlicher Literatur ist ein wichtiges Anliegen für den FID Nahost, daher sehen wir hier eine Bestätigung unserer Erschließungspraxis. Für den Umgang mit Forschungsdaten ergibt sich zunächst keine Notwendigkeit für besondere Maßnahmen.

 

Die zweite Frage richtete sich an die Art der generierten Daten. Ausgehend von der ersten Frage erwarteten wir insbesondere Textdaten, doch neben diesen gibt es einen recht hohen Anteil von numerischen Daten, Fotos, Ton- oder Videoaufzeichnungen und personenbezogenen Daten.

 

Personenbezogene Daten bedürfen einer speziellen Sorgfalt beim Umgang mit Forschungsdaten, weshalb wir diesen Punkt besonders beachten werden, um hier ein gutes Beratungsangebot aufzubauen. Für die Archivierung von Datenbanken müssen ebenfalls besondere Umstände betrachtet werden, für die wir entsprechende Vorbereitungen treffen.

Die dritte Frage zielte auf die verwendeten Datenformate ab, die in Ihren Forschungsdaten Verwendung finden. Es fällt neben einer zu erwartenden größeren Verteilung ein Fokus auf Word- und Excel-Dateien auf. Das ist teilweise problematisch, da es sich bei beiden um proprietäre Datenformate handelt, die für die Langzeitarchivierung nicht gut geeignet sind. Die Verwendung von JPG-Dateien ist ähnlich, doch es handelt sich um lösbare Aufgaben.

 

Die Nutzung proprietärer Dateiformate – insbesondere bei Office-Dateien – ist weit verbreitet und daher im Bereich der Forschungsdaten bereits geklärt. Als allgemeine Empfehlung bietet es sich an, diese Daten neben dem originalen Datenformat in einem offenen Datenformat wie RTF oder CSV zu veröffentlichen, so dass eine Langzeitarchivierung sichergestellt werden kann. JPG-Dateien sollten in ähnlicher Weise zu unkomprimierten TIFF-Dateien konvertiert abgespeichert werden, da das komprimierte JPG-Format zum Datenverlust führen kann. Die zahlreichen genannten, offenen Formate können als unkritisch eingeschätzt werden.

Die Antworten für diese Frage entsprachen in etwa den Erwartungen, sind jedoch ganz klar schwierig. Insbesondere die Speicherung von Forschungsdaten – also als wertvoll einzustufenden Daten – auf privaten Geräten oder Speichermedien ist als äußerst kritisch zu bewerten, da hier die Datensicherheit nicht oder nur unzureichend gegeben ist.

 

Auch die Speicherung auf Arbeitsrechnern ist dabei nur bedingt besser. Hier besteht also ein eindeutiger Bedarf. Wir sehen einen ganz klaren Informationsbedarf. Forschungsdaten sind als wertvolle, schützenswerte Daten eingestuft, weshalb auch ihre Speicherung so gesichert wie möglich und langzeitarchiviert stattfinden sollte. Dies bedeutet, dass ein Ausbau von MENAdoc als Repositorium zur sicheren Aufbewahrung von Forschungsdaten ein gutes Ziel in der Weiterentwicklung darstellt.

In dieser Frage ging es um ganz fachspezifische Besonderheiten bei Forschungsdaten in den orientwissenschaftlichen Fächern. Die Verteilung der Antworten ist hier recht homogen, was zu erwarten war.

 

Diese Schwierigkeiten lassen sich durch eine konsequente Dokumentation und die Verwendung von UTF-8 Codierung weitgehend vermeiden bzw. vereinfachen und sorgen als positiver Nebeneffekt dadurch auch für eine bessere Transparenz bei den Daten. Aus diesem Grund werden wir unser Informationsangebot hier weiter ausbauen.

Mit dieser Frage kommen wir in einen Bereich, der speziell in den Orientwissenschaften Hürden aufbauen kann. Die Antworten verweisen hier auf schwierige politische und juristische Situationen, die selbstverständlich so rechtssicher wie möglich gelöst werden müssen. Die größten Punkte waren dabei die instabile politische Lage (71%), sowie die Gefahr des Quellenverlustes (65%). Zwischen beiden gibt es einen (Teil)zusammenhang, so dass wir hier mit unserer Strategie ansetzen wollen.

 

Die Gefahr des Quellenverlustes stellt im Bereich des Forschungsdatenmanagements eine Herausforderung dar. Sie kann dazu führen, dass Daten, die im regulären Fall nicht als erhaltungswürdig angesehen werden würden, plötzlich große Relevanz erhalten. Das Transkript einer osmanischen Handschrift mag zunächst nicht bedeutungsvoll erscheinen, da jeder Wissenschaftler sich mit Zugang zu der Handschrift selbst innerhalb kurzer Zeit eines anfertigen könnte – liegt diese Handschrift jedoch in einer instabilen Region, in der ein Verlust des Originals ein absehbares Risiko darstellt, wird das Transkript jedoch zu einer wichtigen Information und ein angefertigtes Digitalisat zu einer wertvollen Quelle.

 

Der FID plant hier einen Ausbau des Beratungsangebotes und die Verfügbarmachung einer Lösung zur institutionellen Speicherung von Forschungsdaten ohne Open Access, wenn rechtliche Bedingungen diesen nicht ermöglichen – so sind die Daten an sicherer Stelle abgelegt und für die Nachwelt erhalten.

 

Der Umgang mit personenbezogenen Daten erfordert ebenso spezielle Aufmerksamkeit, hier lässt sich aber mit Methoden der Anonymisierung und Pseudonymisierung arbeiten, um die Daten selbst und auch die Interviewpartner abzusichern und dennoch nutzbar zu halten.

Natürlich stellt sich uns die Frage: Wenn Forschungsdaten allgemein als wichtig erachtet werden, welche Gründe sprechen dann eigentlich gegen eine Veröffentlichung? Die Antworten verweisen auf ganz konkrete, aber vor allem lösbare Probleme, die für uns als FID einen klaren Ansatz ermöglichen.

 

Die am Häufigsten genannten Antworten greifen ineinander über: Es handelt sich um Probleme mit dem mit FDM verbundenen Zeitaufwand, fehlendem Know-How und dem Budget. Bezüglich des Budgets handelt es sich natürlich um einen Posten, der in zukünftiger Anstragsstellung beachtet werden muss. Der FID kann Sie jedoch bereits von der Projektidee an beraten und beim Aufbau des Know-Hows unterstützen, wodurch auch der Zeitaufwand verringert werden kann.

 

Die Angst vor Plagiaten bei der Veröffentlichung von Forschungsdaten ist glücklicherweise unbegründet: Studien zeigen, dass die Erkennung von Plagiaten durch Open Access erheblich vereinfacht ist – das bedeutet, dass Ihre Forschungsdaten nach einer Veröffentlichung sogar besser gegen eine Plagiarisierung geschützt sind.

 

Zu Fragen des Urheberrechts und dem Umgang mit Persönlichkeitsrechten beraten wir Sie ebenfalls gern und bieten gegebenenfalls auch Modelle zur Speicherung von Forschungsdaten an, die nicht Open Access gestellt werden müssen – wichtig ist die zentrale Speicherung, mit der die Daten langfristig erhalten bleiben können.

Selbstverständlich kann es in manchen Fällen auch vorkommen, dass keine Forschungsdaten anfallen, die veröffentlichungswürdig sind – wichtig ist, dass dies nicht einfach vorausgesetzt, sondern in einer Betrachtung des geplanten Projekts oder der geplanten Publikation im Rahmen einer Beratung festgestellt werden kann.

Die Umkehrfrage zur vorigen fragte Sie nach den Gründen für eine Veröffentlichung. Es hat uns erfreut zu sehen, dass hier nicht die Anforderungen der Förderer als treibende Kraft gesehen werden, sondern dass die positiven Aspekte der Veröffentlichung von Forschungsdaten deutlich überwiegen.

 

Diese Antworten sind zentraler Teil unserer Argumentation bei der Bewerbung von Forschungsdatenmanagement im Fachbereich. Der Umfrage konnten wir entnehmen, dass für sie die Sicherung der Qualität und Nachvollziehbarkeit der Daten und eine damit verbundene Zitierfähigkeit und Langzeitarchivierung der Daten an oberster Stelle stehen – unser Plan ist es, mit MENAdoc im Verlauf des Jahres 2019 auf eine neue Infrastruktur umzuziehen, mit der wir genau dies für Sie leisten können.

 

Die Verbesserung eines Austauschs und der Kooperation zwischen Wissenschaftlern und Einrichtungen sehen Sie ebenso als sehr wichtig an – eine Denkweise, die wir vom FID selbstverständlich unterstützen wollen!

In unserer letzten Frage wollten wir wissen, in welchen Bereichen ein Ausbau der Beratungsangebote sinnvoll wäre. Wie Sie dem Diagramm selbst entnehmen können, ist hier eine recht homogene Verteilung erkennbar.

 

Der FID plant die Einrichtung von übersichtlichen Seiten zur Erstinformation sowie den Aufbau eines Beratungsangebotes für Forschungsdaten und Unterstützung bei der Erstellung von Datenmanagementplänen. Wir werden dabei die Antworten aus dieser Umfrage als Grundlage verwenden und unser Angebot kontinuierlich weiterentwickeln.