Skip to content
Publicly Available Published by De Gruyter December 3, 2019

Digitales Datenmanagement als neue Aufgabe für wissenschaftliche Bibliotheken

Digital Data Management as a New Objective for Research Libraries
Heike Neuroth

Fachbereich Informationswissenschaften, Fachhochschule Potsdam, Kiepenheuerallee 5, D-14469 Potsdam

ORCID logo EMAIL logo
, Laura Rothfritz

Fachbereich Informationswissenschaften, Fachhochschule Potsdam, Kiepenheuerallee 5, D-14469 Potsdam

, Vivien Petras

Institut für Bibliotheks- und Informationswissenschaft, Humboldt-Universität zu Berlin, Dorotheenstr. 26, D-10117 Berlin

and Maxi Kindling

Institut für Bibliotheks- und Informationswissenschaft, Humboldt-Universität zu Berlin, Dorotheenstr. 26, D-10117 Berlin

Zusammenfassung

Ausgehend von den aktuellen Entwicklungen in Deutschland und Europa werden Diskussionen, Initiativen und Projektergebnisse im Bereich des digitalen Datenmanagements vorgestellt. Dabei wird ein besonderer Bezug zu den wissenschaftlichen Bibliotheken und deren zukünftige Aufgabenfelder gelegt, die international mit „Data Literacy“ und „Data Stewardship“ beschrieben werden. In Ergänzung zu „Data Scientists“ werden in Zukunft in großer Zahl Experten für das digitale Datenmanagement (sogenannte „Data Stewards“) benötigt. Daher haben das Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin und der Fachbereich Informationswissenschaften der Fachhochschule Potsdam gemeinsam den weiterbildenden Masterstudiengang Digitales Datenmanagement konzipiert, der im April 2019 startete. Wie sich dieser Studiengang in die nationalen und internationalen Entwicklungen und Herausforderungen einfügt, ist Gegenstand dieses Artikels.

Abstract

This article provides an overview over discussions, initiatives, and projects in the field of digital data management while taking currents trends and developments in Germany and Europe into consideration. The main foci of the article are new task areas in research libraries, which are internationally recognized by the terms data literacy and data stewardship. In addition to data scientists, a large number of experts for the management of digital data (so-called data stewards) will be needed in the future. This is why the Berlin School for Library and Information Science at Humboldt-Universität zu Berlin and the Faculty for Information Sciences at the University of Applied Sciences Potsdam have collaborated in designing a new executive Master program Digital Data Management, which started in April 2019. This article elaborates how the Master program is connected to national and international developments and challenges.

1 Einleitung und Hintergrund

Das Jahr 2018 stand ganz im Zeichen von Forschungsdaten. Nicht nur hat das Bundesministerium für Forschung und Entwicklung (BMBF) nach einer Re-Strukturierung des Ministeriums ein eigenes Referat 421 für Forschungsdaten ins Leben gerufen,[1] es gab zudem auf nationaler Ebene eine Reihe weiterer wegweisender Entwicklungen und Veröffentlichungen. Diese standen in Deutschland fast alle im Zeichen des zukünftigen Förderprogramms rund um die Nationale Forschungsdateninfrastruktur (NFDI). Der Rat für Informationsinfrastrukturen (RfII) legte mit der Veröffentlichung des Berichts Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland[2] bereits 2016 den Grundstein für die Strategie eines nationalen Ansatzes des Forschungsdatenmanagements. Im Jahr 2017 erfolgte dann die Veröffentlichung des RfII-Berichts Schritt für Schritt – oder: Was bringt wer mit? Ein Diskussionsimpuls zu Zielstellung und Voraussetzungen für den Einstieg in die Nationale Forschungsdateninfrastruktur (NFDI),[3] gefolgt von der Veröffentlichung Entwicklung von Forschungsdateninfrastrukturen im internationalen Vergleich. Bericht und Anregungen.[4] Kurz darauf veröffentlichte der RfII im Jahr 2018 zwei weitere Publikationen rund um das Thema NFDI, die beide konkrete Impulse für eine Ausgestaltung der NFDI gaben: Zusammenarbeit als Chance. Zweiter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland[5] und In der Breite und forschungsnah: Handlungsfähige Konsortien. Dritter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland.[6]

Ebenfalls im Jahr 2018 veröffentlichte der Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme der Deutschen Forschungsgemeinschaft (DFG) ein Impulspapier zur Stärkung des Systems wissenschaftlicher Bibliotheken in Deutschland,[7] in dem im Kapitel B-2d kurz auch auf Forschungsdaten eingegangen wird. In dem Bericht der Sektion 4 des Deutschen Bibliotheksverbands zu Bibliotheken 2025[8] wird das „Management von Forschungsdaten“ als eins von acht Handlungsfeldern angesehen und auch das Positionspapier der DFG zur Förderung von Informationsinfrastrukturen für die Wissenschaft[9] widmet sich ausführlich der Thematik Forschungsdaten und nennt als ein wichtiges Handlungsfeld u. a. den Aufbau und Entwicklung von Forschungsdatenmanagement-Kompetenz[10] Weiter heißt es dort: „Damit Forschung auch künftig gelingt, müssen für den wissenschaftlichen Nachwuchs einschlägige Lehrangebote entwickelt und mittel- bis langfristig in den Curricula der Universitäten verankert werden. Obwohl dies nicht die ureigene Aufgabe der DFG ist, sollte geprüft werden, wo die DFG-eigenen Förderinstrumente geeignete Ansatzpunkte bieten, um insbesondere den wissenschaftlichen Nachwuchs an den professionellen Umgang mit Forschungsdaten heranzuführen.“[11] Dies ist bemerkenswert, da sich die DFG sonst der Grundlagenforschung verpflichtet sieht.

Aber auch international wird rege über Forschungsdaten diskutiert, wie die Aktivitäten der internationalen Initiative Research Data Alliance – Research Data Sharing without barriers[12] zeigen. Sie decken ein breites Spektrum, angefangen von Schulungsmaßnahmen über den Aufbau von adäquater Infrastruktur bis hin zur Entwicklung von tragfähigen und Geschäftsmodellen, ab. Eine zentrale Entwicklung war auch die von der EU-Kommission intensiv vorbereitete und im November 2018 im Rahmen der österreichischen Ratspräsidentschaft verkündete European Open Science Cloud (EOSC).[13] Die EU hat im Kontext des Launch der EOSC im November 2018 zwei weitere wichtige Berichte veröffentlicht,[14] die sich hauptsächlich mit Regularien für verschiedene Beteiligungsszenarien beschäftigen: Various aspects of how EOSC can effectively interlink People, Data, Services and Training, Publications, Projects and Organisations und den Bericht Turning FAIR into reality. Der zuletzt genannte Bericht beschreibt „the broad range of changes required to turn FAIR data into reality.“[15] Die Durchsicht der Kapitel zeigt auf, welche Themen im Bereich von Forschungsdaten in Zukunft auch auf die wissenschaftlichen Bibliotheken zukommen:

  1. Kap. 1.4: Data science and stewardship skills

  2. Kap. 1.5: Metrics for FAIR data and assessment frameworks to certify FAIR services

  3. Kap. 1.6: Sustainable and strategic funding

  4. Kap. 1.7: Priority recommendations

  5. Kap. 3.4: Data Management Plans and FAIR

  6. Kap. 4.3: Data standards, metadata standards, vocabularies and ontologies

  7. Kap. 4.4: Registries, repositories and certification

  8. Kap. 5.1: Data science and data stewardship skills for FAIR

  9. Kap. 5.2: Professionalizing roles and curricula

  10. Kap. 6.1: Metrics/indicators

Allen Initiativen, Entwicklungen und Diskussionen sowie konkreten Förderprogrammen liegt der Gedanke der FAIR-Prinzipien [16] zugrunde, die perspektivisch einen menschen- und vor allem auch maschinenlesbaren Zugang zu Forschungsdaten gemäß der FAIR-Prinzipien „Findable – Accessible – Interoperable – Reusable“ ermöglichen sollen.

Die Bund-Länder-Vereinbarung zu Aufbau und Förderung einer Nationalen Forschungsdateninfrastruktur (NFDI),[17] veröffentlicht am 26. November 2018, weist in ihrer Präambel auf die Notwendigkeit von NFDI-Konsortien als „wissenschaftlich breit nutzbare Datenschätze mit gesellschaftlichem Mehrwert hin und macht in ihren Förderkriterien darauf aufmerksam, dass „ein stimmiges Konzept zu Datennutzung und -zugang sowie Auffindbarkeit und Nachnutzbarkeit der Daten, welches entlang der FAIR-Prinzipien ausgerichtet ist[18] vorliegen muss. Dafür stehen im Zeitraum von 2019 bis 2028 bis zu 90 Mio. Euro pro Jahr im Endausbau für die Projektförderung der NFDI zur Verfügung, was insgesamt eine beachtliche Fördersumme darstellt.

Passend dazu eröffnete der Stifterverband 2018 ein eigenes Förderprogramm für neue Lehr- und Lernkonzepte in diesem Bereich. Der Stifterverband versteht unter Data Literacy Folgendes:

„Data literacy ist eine grundlegende Kompetenz, um in der digitalen Welt in Wissenschaft, Arbeitswelt und Gesellschaft bestehen und teilhaben zu können. Data Literacy ist die Fähigkeit, planvoll mit Daten umzugehen und sie im jeweiligen Kontext bewusst einsetzen und hinterfragen zu können. Dazu gehört: Daten zu erfassen, erkunden, managen, kuratieren, analysieren, visualisieren, interpretieren, kontextualisieren, beurteilen und anzuwenden. Data Literacy gestaltet die Digitalisierung und die globale Wissensgesellschaft in allen Sektoren und Disziplinen. Gleichzeitig müssen Hochschulabsolvierende aller Fächer über fachspezifische Datenkompetenzen für die Wissenschaft und für die Arbeitswelt verfügen.“[19]

Mit Blick auf das Datenmanagement durch Informationsinfrastruktureinrichtungen lässt sich diese Definition aufgreifen und erweitern: Data Literacy ist die Kompetenz des kritischen und lösungsorientierten Umgangs mit digitalen Daten. Sie umfasst die Auseinandersetzung mit digitalen Daten, angefangen bei ihrer Entstehung über die Prozesse, Instrumente und Infrastrukturen zu ihrer Verarbeitung, Analyse und Bereitstellung inklusive Publikation bis hin zu ihrer langfristigen Sicherung und Nachnutzung. Neben dem planvollen und kritischen Einsatz von Daten für verschiedene (interdisziplinäre) Kontexte ist die kritische Auseinandersetzung, d. h. das Verstehen, Analysieren und Bewerten von rechtlichen, ethischen, technischen und organisatorischen Rahmenbedingungen, Anforderungen und Lösungen bedeutend. Dieses konzeptuelle Wissen ist darüber hinaus in die verschiedenen Domänen wie Forschung und Wissenschaft, Kultur, Gesellschaft und Wirtschaft übertragbar.

Auch die Arbeitsgruppe Forschungsdaten der Schwerpunktinitiative Digitale Information der Allianz der deutschen Wissenschaftsorganisationen benennt im Februar 2018 mit Research Data Vision 2025 in Empfehlung 5 die Notwendigkeit, Angebote zu Aus- und Weiterbildungen auszubauen:

„Um den großen Bedarf an Daten-Expertinnen und -Experten zu decken, sollten sowohl spezifische Studiengänge an Hochschulen als auch entsprechende Ausbildungsgänge in der beruflichen Bildung entwickelt bzw. ausgebaut werden. Zudem sollten auch in allen Studiengängen und Berufsausbildungen allgemeine Grundkenntnisse in digitalen Daten und Methoden vermittelt werden, ergänzt durch Fort- und Weiterbildungsmaßnahmen in späteren Berufsphasen.“[20]

Es kann also davon ausgegangen werden, dass Forschungsdaten eines der beherrschenden Themen der näheren Zukunft darstellen, v. a. auch für die wissenschaftlichen Bibliotheken. Auch wenn fast alle Berichte und Veröffentlichungen fordern, qualifiziert in „Köpfe“ oder „Personal“ zu investieren, ist in Deutschland bis auf zahlreiche Aktivitäten rund um Data Science, Data Analysis oder Data Engineering etc. unklar, wie Bibliotheken das Thema digitales Datenmanagement systematisch aufgreifen und in ihren Geschäftsprozessen und Diensten implementieren können und vor allem, wer die nötige Fachexpertise hat, dies umzusetzen.

2 Die Landschaft der Studiengänge in Deutschland

Data Science bzw. Data Scientist ist zwar in aller Munde und in Deutschland sprießen neue Studien- und Weiterbildungsangebote aus dem Boden, dennoch ist ein Defizit im Bereich des ganzheitlichen digitalen Datenmanagements – oder Englisch: Data Stewardship – zu beobachten. Doch was genau ist der Unterschied zwischen Data Science auf der einen Seite und Data Stewardship auf der anderen Seite? Hierzu liefert u. a. ein EU-Bericht zu den FAIR Data Principles eine Antwort, in dem der gesamte Lebenszyklus von Forschungsdaten berücksichtigt wird:

„A broad range of data skills are needed across the research lifecycle. These cover data science skills to ensure research communities handle data appropriately and can exploit FAIR data resources, as well as stewardship skills to ensure data are FAIR, properly managed, preserved and shared. Although these skills may often be combined in the same individual, and need to be shared by researchers, it is worth emphasising the need to enhance these skill-sets and drive towards greater specialisation in these two areas in order to make FAIR data a reality.“[21]

Im Jahr 2017 fand innerhalb eines Projektteams der Fachhochschule Potsdam eine umfängliche Erhebung und Katalogisierung von Studiengängen in Deutschland statt. Die Studie basierte auf Vorarbeiten der HRK-Geschäftsstelle[22] und erfasste diejenigen Studiengänge im Detail, die sich explizit mit digitalen Daten im weitesten Sinne beschäftigen. Insgesamt wurden 49 Studiengänge analysiert und anhand der Kategorien Data Science, Data Management, Data Analysis, Data Curator sowie Data Librarian eingruppiert. Ziel war es zu untersuchen, ob auch Forschungsdatenmanagement oder allgemeiner digitales Datenmanagement in den bereits existierenden Studienangeboten berücksichtigt ist. Die Analyse ergab, dass es zurzeit kein einziges Studienangebot in Deutschland mit dem Schwerpunkt digitales Datenmanagement gibt, weder berufsbegleitend noch konsekutiv.

Die meisten Studienangebote mit dem Label Data Science sind in der Informatik angesiedelt und bieten in den meisten Fällen nur vereinzelt Lehrangebote in Richtung Datenmanagement an. Einige Studienangebote haben darüber hinaus einen (weiteren) fachlichen Schwerpunkt, z. B. im Gesundheitswesen oder Sport. Analysen der Modulhandbücher haben gezeigt, dass zum großen Teil (deutlich) weniger als 30 % auf die neuen Herausforderungen in den Themengebieten Management digitaler Daten, Forschungsdatenmanagement oder Datenkuration eingegangen wurde. Da es auch international noch keine einheitliche Terminologie gibt, was genau mit Data Science, Data Analysis, Data Management etc. gemeint ist, herrscht auch in Deutschland keine Klarheit darüber, was die relevanten Lehrinhalte sind, welche Kernkompetenzen vermittelt werden müssen oder welche Berufsziele bzw. Berufsbilder sich mit einem Abschluss ergeben. Es bleibt festzuhalten, dass Studiengänge mit zumindest einigen Lehr-Angeboten im Bereich Data Curation, Data Management oder Data Librarian immer noch deutlich in der Unterzahl sind und bisher in Deutschland nicht eigenständig als Bachelor- oder Masterstudiengang studiert werden können.

Dies mag auch daran liegen, dass es – im Gegensatz zum Beispiel zu Diskussionen und konkreten Umsetzungen in den Niederlanden (s. u.) – in Deutschland noch keine konkreten Vorstellungen über Arbeitsschwerpunkte und Berufsbilder im Kontext von (wissenschaftlichem) Datenmanagement gibt. Gerade in Arbeitsumgebungen wissenschaftlicher Bibliotheken spielen allerdings digitale Daten und das Management von Forschungsdaten eine immer größer werdende Rolle.

Auch wenn in diesem Artikel vom Digitalen Datenmanagement die Rede ist, so ist nach dem Verständnis der Autorinnen Data Steward ein neues Berufsbild, welches mit dem Studiengang Digitales Datenmanagement (DDM) hauptsächlich bedient wird. Einige informationswissenschaftliche Hochschulen in Deutschland bieten bereits (Teil-)Module an, die Angebote aus dem Data-Stewardship-Kompetenzbereich (s. u.) enthalten. Zu nennen sind hier insbesondere die beiden folgenden Studiengänge:

  1. Data and Information Science (Bachelor) an der TH Köln[23]

  2. Berufsbegleitender Master in Bibliotheksinformatik (M.Sc.) an der TH Wildau[24]

An der TH Köln wurde das bisherige Studienangebot unlängst weiterentwickelt und auf die neuen Bedarfe ausgerichtet. Das Institut für Informationswissenschaft der TH Köln bietet im Bachelorstudiengang Data and Information Science die Studienschwerpunkte Data Librarian und Data Analyst an.[25]

3 Digitales Datenmanagement und Kompetenzen im Bereich von FAIRen Daten

Die FAIR Data Principles wurden 2014 im Rahmen eines Workshops zusammen mit unterschiedlichen Akteuren aus Wissenschaft, Infrastruktur und Wirtschaft formuliert und 2016 durch eine Arbeitsgruppe der FORCE11 Initiative konstituiert.[26] Die Prinzipien sind dabei nicht als feste Standards anzusehen, sondern zeigen Ziele auf, welche die langfristige Auffindbarkeit und Nachnutzbarkeit von (Meta-)Daten erleichtern sollen.[27]

Das Ziel des „guten“ Datenmanagements sind qualitativ hochwertige Forschungsergebnisse, die sowohl von Menschen als auch insbesondere von Maschinen leicht auffindbar (findable), zugänglich (accessible), vielseitig verwendbar und technisch integrierbar (interoperable) und nachnutzbar (reusable) sind. Hervorgehoben wird die maschinelle Komponente bei der (teil-)automatischen Ausführung der Auffindung, des Zugriffs, der Interoperabilität und der Nachnutzung von Daten. International finden sich zunehmend Initiativen, Policies und Projekte, die sich an diesen FAIR Data Principles orientieren, wie beispielsweise die European Open Science Cloud (EOSC) und die internationale GO FAIR Initiative.[28] GO FAIR hat zum Ziel, technische Infrastrukturen bzw. Dienste bereitzustellen (GO BUILD), die Prinzipien kulturell zu festigen (GO CHANGE) und durch Trainings in den unterschiedlichen Wissenschaftsbereichen zu verankern (GO TRAIN).[29]

Die Europäische Kommission empfiehlt für die Umsetzung der FAIR Data Principles, neue Arten von Kompetenz- und Aufgabenfeldern zu entwickeln, die auch in konkrete Professionen münden sollen. Für die datengetriebene Forschung werden einerseits speziell ausgebildete Data Scientists benötigt, die in der Lage sind, in dem jeweiligen Fachgebiet die Forschungsprojekte zu begleiten und in Kooperation mit den jeweiligen Fachwissenschaftlerinnen[30] Datenanalysen etc. durchzuführen. Andererseits unterstreicht die Europäische Kommission die Notwendigkeit der Ausbildung von Data Stewards, die während des Forschungsprozesses und darüber hinaus das Datenmanagement und die Datenkuration im Hinblick auf die spätere Auffindbarkeit, Zugänglichkeit, Interoperabilität und Nachnutzbarkeit der im Forschungsprozess entstehenden digitalen Daten sicherstellen und professionell betreuen. Barend Mons, Vorsitzender der High Level Expert Group on the European Open Science Cloud gab in einem Interview an, dass für eine effektive Umsetzung der European Open Science Cloud in Europa bis zu 500 000 Data Stewards ausgebildet werden müssten.[31] Entsprechend heißt es im EU-Bericht FAIR Data Action Plan, der im Juni 2018 veröffentlicht wurde, in der Empfehlung Nummer 13 mit dem Titel Professionalise data science and data stewardship roles: „Steps need to be taken to develop two cohorts of professionals to support FAIR data: data scientists embedded in those research projects which need them, and data stewards who will ensure the management and curation of FAIR data.“[32]

Hervorzuheben ist hierbei auch die Überlegung, dass dieser Begleitprozess möglichst frühzeitig, am besten gleich zu Anfang eines Forschungsprozesses, beginnen sollte. Insbesondere die spätere Nachnutzbarkeit und hiervon abhängig die Interoperabilität digitaler Daten stehen im direkten Zusammenhang mit dem Forschungsdesign und der Forschungsmethode. Data Stewards übernehmen hierbei auch eine Brückenfunktion zwischen den vorhandenen Infrastrukturangeboten einer Forschungseinrichtung (z. B. dem Forschungsdatenrepositorium) und den Wissenschaftlerinnen.[33] Dieses, den Forschungsprozess begleitende Data Stewardship, lässt sich – angelehnt an das schon praktizierte Konzept des Embedded Librarianship[34] – auch als Embedded Data Stewardship bezeichnen.

Von besonderer Bedeutung für den Bereich Digitales Datenmanagement ist die vielfach auch von wissenschafts- und förderpolitischer Seite eingeforderte Nachnutzbarkeit und Nachnutzung von Forschungsdaten. In den FAIR Data Principles wird „Re-use“ als das Maximalziel[35] des „FAIRification“-Prozesses dargestellt, für welches das Erreichen bzw. die Umsetzung der anderen drei Kriterien Findable, Accessible und Interoperable vorausgesetzt werden. Daher sollte dieses Kriterium konsequent von Beginn an mitgedacht werden; es wird nun etwas näher erläutert sowie der aktuelle internationale Diskussionsstand zusammengefasst.

Es herrscht international Konsens darüber, dass Re-use von Forschungsdaten eine Herausforderung in vielerlei Hinsicht darstellt. Dies beginnt mit dem Begriff der Nachnutzung bzw. dem in manchen Kontexten missverständlichen Präfix ‚Nach‘ und den unterschiedlichsten Formen von Nachnutzung und endet in praktischen Fragen der Nachnutzbarkeit und Sichtbarmachung von Nachnutzung. Die Zitierung von Datensätzen wird technisch inzwischen durch Informationsinfrastrukturangebote wie Forschungsdatenrepositorien ermöglicht. In einigen Fachdisziplinen sind Forderungen seitens der Fachzeitschriften, die den Publikationen zugrundeliegende Daten auch bereitzustellen, inzwischen anerkannt und diese Praxis etabliert sich.[36] Dennoch ist bislang über die Nachnutzung von Forschungsdaten abgesehen von den Herausforderungen wenig bekannt. Untersuchungen ergaben, dass die Nachnutzbarkeit von Forschungsdaten eine Vielzahl an Herausforderungen an die Wissenschaftlerinnen und Infrastruktureinrichtungen stellt. Beispielsweise sind das Auffinden von und der Zugriff auf Daten oft bereits aufgrund fehlender Erschließung oder durchsuchbarer Infrastrukturangebote schwierig, die inhaltliche Aussagekraft der Daten ist aufgrund fehlender inhaltlicher Metadaten ohne eigene, genauere Analysen nicht zu verstehen, die Qualität der Forschungsdaten ist schwer zu ermessen oder es herrscht Unsicherheit über die rechtlichen Bedingungen der Nachnutzung aufgrund fehlender oder unklarer Lizenzen.[37] Hinter dieser Position steht eine Vielzahl von Argumenten, die für die Fachdisziplinen und Forschungsformen allerdings auch unterschiedliche Relevanz haben. Sowohl die Entwicklung und Evaluation von konkreten Lösungen für die Nachnutzbarkeit von Daten als auch die Rahmenbedingungen, Akzeptanz und Formen der Nachnutzung sind bibliotheks- und informationswissenschaftliche Forschungs- und Anwendungsfelder, die durch das Digitale Datenmanagement aufgegriffen werden.

Obwohl die Notwendigkeit eines Data-Stewardship-Konzepts im Zuge der Zugänglichkeit und der Nachnutzbarkeit von digitalen Daten international gesehen wird, sind die Prozesse und entsprechende Rollenverteilungen bislang wenig oder gar nicht formalisiert. York et al. (20189 beschreiben in ihrer Studie die Desiderate, die nach wie vor in der Operationalisierung eines effektiven Data Stewardship bestehen. Unklarheit herrscht demnach bei Themenfeldern, die sich grob in sechs Kategorien wie beispielsweise Knowledge und Stewardship Actions clustern lassen.[38] Die Kategorie Knowledge bezeichnet dabei die Diskrepanz zwischen dem Wissen (inklusive rechtlichen und ethischen Aspekten), welches für die Planung eines effektiven Data Stewardship und die bestmögliche Nachnutzung von Forschungsergebnissen einerseits erforderlich und andererseits aktuell wirklich vorhanden ist. Stewardship Actions beschreibt die Defizite in den Bereichen der Kuratierung, des Managements, der Archivierung, der nachhaltigen Planung entsprechender Maßnahmen zur Kuratierung (sustainability), der notwendigen Zusammenarbeit zwischen relevanten Stakeholdern (collaboration), der noch unbefriedigenden Anzahl an veröffentlichten und zugänglichen Daten (sharing and access), der Auffindbarkeit (discovery) und der Nachnutzung der Daten (reuse).[39] Um diese Lücken zwischen Theorie und Praxis zu schließen, werden qualifizierte Ausbildungsangebote benötigt, die Kompetenzen für den effektiven Umgang mit digitalen Daten sowie ein gutes Data Stewardship ermöglichen. Ausbildungsangebote meint hier ein breites und weites Spektrum, von dezidierten Studiengängen im Bachelor und Master über berufsbegleitende Studiengänge bis hin zu Schulungs- und Weiterbildungsangeboten.

Bestehende Angebote für Schulung und Weiterbildung im Bereich Forschungsdatenmanagement lassen sich in drei grobe Kategorien einteilen. Zum ersten besteht bereits eine Vielzahl von Beratungs- und Trainingsangeboten zum Forschungsdatenmanagement für wissenschaftlich Arbeitende, die an wissenschaftlichen Einrichtungen, in den meisten Fällen von Bibliotheken, angeboten werden.[40] Insbesondere die Beratung und Unterstützung von Wissenschaftlerinnen bei der Erstellung von Datenmanagementplänen sowie der Publikation und Langzeitarchivierung von Forschungsdaten auf entsprechenden Repositorien sind Servicebereiche, in denen sich Bibliotheken zunehmend positionieren. Eine weitere Kategorie sind Angebote, die diejenigen ansprechen, die selbst Beratungsangebote durchführen oder entwickeln wollen. Das BMBF-geförderte Projekt FDMentor hat beispielsweise ein umfassendes und nachnutzbares Train-the-Trainer-Konzept entwickelt.[41] Das aus dem anglo-amerikanischen Raum stammende Konzept der Library bzw. DataCarpentry Workshops[42] fällt ebenso in diese Kategorie, wenn auch die Workshops inhaltlich spezifisch auf die Vermittlung von Softwarekompetenzen für das Datenmanagement ausgerichtet sind. Sie richten sich explizit an bibliothekarisches Personal und werden nun auch in Deutschland mit Unterstützung des VDBs in Form eigener Workshops aufgegriffen.[43] Die dritte Kategorie sind dezidierte Studiengänge, die die oben genannten und eingeforderten Berufsfelder bedienen.

Internationaler Vorreiter für die praktische Umsetzung des Data Stewardships ist die Technische Universität Delft, wo ein Netzwerk von insgesamt acht Data Stewards aufgebaut wird, die direkt an den jeweiligen Fakultäten angesiedelt sind und übergeordnet durch eine an der Bibliothek angesiedelte Stelle koordiniert werden.[44]

Die von der Europäischen Kommission eingesetzte Expert Group on FAIR data empfiehlt:

„New job profiles need to be defined and education programs put in place to train data professionals – from data stewards to data scientists – who are urgently required to bring FAIR principles to practice and establish the necessary trust and understanding to support data reuse. In order to develop these new professionals, agreed pedagogy and curricula are needed.“[45]

Auch der Rat für Informationsinfrastrukturen in Deutschland (RfII) unterstreicht die Notwendigkeit der Entwicklung entsprechend neuer Studiengänge in seinem bereits 2017 veröffentlichten Bericht Leistung aus Vielfalt.[46] Die Weiterentwicklung bereits bestehender Studiengänge sowie die Entwicklung neuer Studiengängen ist somit ein Desiderat, welches sowohl von der Wissenschaft als auch von der Politik gefordert wird.

4 Der Studiengang Digitales Datenmanagement

Als im Rahmen erster Gespräche während der RDA-DE-Tagung Ende 2016 zwischen Vertreterinnen des Instituts für Bibliotheks- und Informationswissenschaft (IBI, HU Berlin) und des Fachbereichs Informationswissenschaft der FH Potsdam besprochen wurde,[47] sich gemeinsam den neuen Herausforderungen des digitalen Datenmanagements zu stellen, waren weder die schnelle Entwicklung noch die lauter werdenden Stimmen nach neuen Aus- und Weiterbildungsangeboten absehbar. Dies war auch gut so, denn die Entwicklung und Einrichtung neuer Studiengänge erfordert generell viel Zeit[48] und in diesem Fall galt es; einen neuen Studiengang unter besonderen Rahmenbedingungen zu entwickeln, da es sich um eine Bundesland- und hochschulübergreifende Kooperation handelt. Auch werden Kooperationen im Bereich der Lehre über Bundeslandgrenzen hinweg weder politisch systematisch unterstützt noch finanziell gefördert.

Insofern ist das gemeinsame Angebot der HU Berlin und der FH Potsdam des weiterbildenden Masterstudiengangs Digitales Datenmanagement (DDM[49]) im Bereich der Informations- und Bibliothekswissenschaft in Deutschland einmalig und bündelt die Expertisen beider Einrichtungen, um den neuen und komplexen Herausforderungen im digitalen Datenmanagement[50] gerecht zu werden.

Bei der inhaltlichen Konzeptionierung des Studiengangs DDM waren Ergebnisse aus drei EU-Projekten hilfreich und bildeten neben den eigenen, langjährigen Lehr- und Forschungserfahrungen an den beiden Hochschulen den Ausgangspunkt für die Entwicklung und den Aufbau des Curriculums:

  1. DigCurV – Skills in Digital Curation Curriculum Framework[51]

  2. European Open Science Cloud for Research Pilot Projects, Deliverable 7.1: Skills landscape analysis and competence model[53]

Hilfreich dabei war auch, in Abgrenzung zu Data Science, die notwendigen Inhalte für ein umfassendes Data Management zu erarbeiten.

Insbesondere die Ergebnisse des Berichts EOSCpilot/D7.1 halfen, die zu lehrenden Fähigkeiten und Kompetenzen für den Studiengang DDM zu definieren, da er vier übergeordnete Kompetenzcluster im Bereich des Data Stewardship definiert, zwischen denen Data Stewardship als Schwellenkonzept existiert:

  1. Data Science/Analytics

  2. Data Management

  3. Data Science Engineering und

  4. Domain Research

Ausgehend von dem bereits etablierten Konzept des Data Lifecycle[54] wurden in D7.1 Fertigkeiten (Skills) aus drei vorherigen Projekten[55] herangezogen und den jeweiligen Kompetenzgebieten zugeordnet.[56] Die folgende tabellarische Übersicht verdeutlicht exemplarisch die Herangehensweise an einem Ausschnitt im Kompetenzgebiet Plan and design, Integrate and analyse sowie Appraise and preserve:

Tab. 1
EOSC Competence Group Inhalte laut EOSCpilot D7.1 Entsprechende Lehrangebote in DDM (M=Modul)
Plan and design Data management planning

Data model development

Database specification and design

Metadata specification

File format selection

Data repository requirements
M 1.1 Theoretische Grundlagen Datenmanagement und Data Literacy

M1.4 Metadaten, Standards, Interoperabilität

M3.1 Forschungsdatenmanagement

M3.2 Datenmanagementpläne
Integrate and analyse Data preparation

Data mining

Data versioning

Data transformation

Data processing and statistical analysis tools

Analysis workflows
M2.1 Informationstechnische Grundlagen: Internet- und Webtechnologien

M2.3 Einführung in Algorithmen und Datenstrukturen

M3.1 Datenanalyse und Datenvisualisierung

M3.4 Datenanalyse und Datenvisualisierung
Appraise and preserve Data provenance

Data quality

Data review and appraisal

Preservation planning

File format migration

Data preservation
M3.1 Forschungsdatenmanagement

M3.2 Datenmanagementpläne

Insgesamt deckt der ab April 2019 zum ersten Mal startende Masterstudiengang Digitales Datenmanagement nachfolgend aufgeführte Themenfelder ab. Für detaillierte Informationen zu Struktur und Organisation des Studiengangs sei auf einen weiteren Artikel in ABI-Technik verwiesen.[57]

  1. Rahmenbedingungen des Datenmanagements, inklusive

    1. Theoretische Grundlagen Datenmanagement und Data Literacy

    2. Forschungs- und Informationsinfrastrukturen

    3. Open Access, Open Data und Open Science

    4. Metadaten, Standards, Interoperabilität

  2. Technologien des Datenmanagements, inklusive

    1. Informationstechnologische Grundlagen: Internet- und Webtechnologien

    2. Informationstechnologische Grundlagen: Datenmanagementsysteme

    3. Einführung in Algorithmen und Datenstrukturen

    4. Digitale Repositorien

  3. Methoden des Datenmanagements

    1. Forschungsdatenmanagement

    2. Datenmanagementpläne

    3. Statistische Methoden in der Datenaufbereitung und -auswertung

    4. Datenanalyse und Datenvisualisierung

  4. Projektmodule

    1. Designprojekt

    2. Transferprojekt

    3. Agiles Projektmanagement I und II

  5. Vertiefungsmodul, z. B.

    1. Reallabor Daten

    2. Reallabor Technologie

    3. Reallabor Methodik

    4. Ausgewählte Themen des Datenmanagements (z. B. Ethik)

Der Studiengang DDM adressiert damit auch neue Berufsfelder, da er das Ziel verfolgt, Fachpersonal für zum Teil bereits bestehende und in Zukunft deutlich an Bedeutung gewinnende Aufgabengebiete rund um den Umgang mit digitalen (Forschungs-)Daten auszubilden und entsprechend zukunftsorientiert zu qualifizieren. Potenzielle Berufsfelder für Absolventinnen des Studiengangs finden sich gleichermaßen an Hochschulen, in Forschungs- und Serviceeinrichtungen der Informationsinfrastrukturen wie z. B. in wissenschaftlichen Bibliotheken als auch in Wirtschaftsunternehmen.

Aufgrund der zunehmenden Digitalität aller Forschungsbereiche sowie den lauter werdenden Forderungen nach zugänglicher, transparenter und replizierbarer Forschungsergebnisse ist davon auszugehen, dass sich das digitale Datenmanagement im Bereich der Wissenschaft in einer hohen Anzahl bestehender und neuer Berufsfelder wiederspiegeln wird.

Gerade im Bereich des Datenmanagements, welches digitale Forschungsprozesse begleitet, werden Verantwortlichkeiten und Rollen in Zukunft weiter ausdifferenziert und verteilt werden müssen, was den Bedarf an qualifiziertem Fachpersonal steigern wird: „Formal career pathways need to be developed to recognise and reward those who undertake data roles, as well as recognising core data skills as part of every researcher’s profile.“[58]

Absolventinnen des Masterstudiengangs Digitales Datenmanagement werden in der Lage sein, diejenigen Aufgaben zu übernehmen, die u. a. auch von der EU dem Aufgabenfeld Data Steward zugeordnet wird. Diese umfassen:

  1. die Aufarbeitung, Bereinigung, Strukturierung und Organisation von Daten während des aktiven Forschungsprozesses, sowie deren Beschreibung mit Metadaten,

  2. die Dokumentation dieses Prozesses und die Unterstützung während des Veröffentlichungsprozesses der Daten um die Nachnutzbarkeit zu maximieren,

  3. die langfristige und nachhaltige Sicherung der Verfügbarkeit der Daten,

  4. die (Weiter-)Entwicklung von Standards, Best Practices und Interoperabilitätsframeworks für die jeweiligen Forschungscommunities.[59]

Darüber hinaus wird es durch Zertifikatskurse[60] möglich sein, einzelne Teil-Module oder komplette Module zu belegen, so dass nicht für den gesamten, kostenpflichtigen Studiengang immatrikuliert werden muss, sondern je nach Bedarf eine Weiterbildung in spezifische Themenbereiche angeboten wird.

5 Ausblick

Die beiden Hochschulen HU Berlin und FH Potsdam haben mit dem weiterbildenden Masterstudiengang Digitales Datenmanagement (DDM) einen ersten konkreten Vorschlag für einen neuen Studiengang vorgelegt, der im Sommersemester 2020 starten wird und der den neuen Anforderungen und Herausforderungen, wie sie insbesondere im Umfeld der European Open Science Cloud und den FAIR Prinzipien formuliert werden, gerecht wird. Der Studiengang verfolgt dabei das Ziel, Absolventinnen für das Profil des Data Stewardships auszubilden und damit international anschlussfähig zu sein. Es bleibt zu vermuten, dass aus der deutschen Hochschullandschaft sehr bald weitere Angebote folgen (müssen), zumal der Aufbau der Nationalen Forschungsdateninfrastruktur in Deutschland ansteht. Wünschenswert ist, dass es dafür sehr bald dezidierte Förderprogramme gibt, da die Umstellung und Weiterentwicklung existierender sowie die Neu-Entwicklung weiterer Studienangebote mit Bordmitteln allein flächendeckend nicht zu stemmen sein wird. Nicht nur, dass es neues, inhaltlich ausgebildetes Personal für die Lehre und Forschung braucht, auch eine sorgfältige Sichtung bisheriger Empfehlungen (z. B. EU) und internationaler Aktivitäten sowie relevanter Publikationen ist eine wichtige Voraussetzung, um international Schritt halten und die Wissenschaft auch in internationalen Verbundprojekten optimal unterstützen zu können. Wünschenswert wäre es auch, in Deutschland eine koordinierte Debatte darüber zu führen, wohin sich die Bibliotheks- bzw. Informationswissenschaft(en) entwickeln soll(en).

Dabei können z. B. auch folgende Fragen angesprochen werden:

  1. Welche Rolle spielt die Bibliotheks-/Informationswissenschaft im großen Gebiet der Datenwissenschaft (Data Science)?

  2. Wie könnte eine Begleitforschung insgesamt die Diskussionen um Open Science, FAIR etc. unterstützen? Es ist zu erwarten, dass in naher Zukunft verstärkt Fragen auftauchen, die sich mit Metriken, der Evaluation von FAIR-Kriterien und insgesamt mit dem FAIRification-Prozess beschäftigen.

  3. Wie und wie schnell ändert sich das Berufsbild des wissenschaftlichen Bibliothekars? Welche Art(en) von Ausbildung braucht es dann für welche Rollen?

Auch wenn die langen Entwicklungsprozesse von Studiengängen an deutschen Hochschulen der schnellen Etablierung neuer Berufsbilder und Forschungsgebiete zwangsläufig nachstehen, können ähnliche Initiativen an anderen Hochschulen erwartet werden. Unter Berücksichtigung weiter zu schaffender Qualifizierungsangebote und Studiengänge wird in der bibliotheks- und informationswissenschaftlichen Fachcommunity über eine Standardisierung und Zertifizierung der Inhalte weiter nachgedacht werden müssen.

Über die Autoren

Heike Neuroth

Fachbereich Informationswissenschaften, Fachhochschule Potsdam, Kiepenheuerallee 5, D-14469 Potsdam

Laura Rothfritz

Fachbereich Informationswissenschaften, Fachhochschule Potsdam, Kiepenheuerallee 5, D-14469 Potsdam

Vivien Petras

Institut für Bibliotheks- und Informationswissenschaft, Humboldt-Universität zu Berlin, Dorotheenstr. 26, D-10117 Berlin

Maxi Kindling

Institut für Bibliotheks- und Informationswissenschaft, Humboldt-Universität zu Berlin, Dorotheenstr. 26, D-10117 Berlin

6 Literaturverzeichnis

Arbeitsgruppe Forschungsdaten (2018): „Research Data Vision 2025“ – ein Schritt näher: ein Diskussionspapier der Arbeitsgruppe Forschungsdaten der Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen, Potsdam: Deutsches GeoForschungsZentrum GFZ. Verfügbar unter http://doi.org/10.2312/allianzoa.024.Search in Google Scholar

Biernacka, Katarzyna et al. (2018): Train-the-Trainer Konzept zum Thema Forschungsdatenmanagement. Verfügbar unter https://doi.org/10.5281/zenodo.1215377.Search in Google Scholar

Cope, Jez, und Baker, James (2018): Library Carpentry: Software Skills Training for Library Professionals. In: International Journal of Digital Curation 12 (2), 266–73. Verfügbar unter https://doi.org/10.2218/ijdc.v12i2.576.10.2218/ijdc.v12i2.576Search in Google Scholar

Deutscher Bibliotheksverband (2018): Wissenschaftliche Bibliotheken 2025. Verfügbar unter https://www.bibliotheksverband.de/fileadmin/user_upload/Sektionen/sektion4/Publikationen/2018_02_27_WB2025_Endfassung_endg.pdf.Search in Google Scholar

Deutsche Forschungsgemeinschaft (2018): Stärkung des Systems wissenschaftlicher Bibliotheken in Deutschland. Ein Impulspapier des Ausschusses für Wissenschaftliche Bibliotheken und Informationssysteme der Deutschen Forschungsgemeinschaft. Verfügbar unter http://www.dfg.de/download/pdf/foerderung/programme/lis/180522_awbi_impulspapier.pdf.Search in Google Scholar

Deutsche Forschungsgemeinschaft (2018a):. Förderung von Informationsinfrastrukturen für die Wissenschaft. Ein Positionspapier der Deutschen Forschungsgemeinschaft. Verfügbar unter http://www.dfg.de/download/pdf/foerderung/programme/lis/positionspapier_informationsinfrastrukturen.pdf.Search in Google Scholar

European Commission Expert Group on FAIR Data (2018): Turning FAIR into Reality : Final Report and Action Plan from the European Commission Expert Group on FAIR Data. Verfügbar unter https://doi.org/10.2777/1524.Search in Google Scholar

Fühles-Ubach, Simone (2018): Bibliothekare und Data Librarians – neue Profile für das bibliothekarische Fachpersonal der Zukunft“. In: o-bib. Das offene Bibliotheksjournal, 5 (4), 7–17. Verfügbar unter https://doi.org/10.5282/o-bib/2018H4S7-17.Search in Google Scholar

Gemeinsame Wissenschaftskonferenz (2018): Bund-Länder-Vereinbarung zu Aufbau und Förderung einer Nationalen Forschungsdateninfrastruktur (NFDI). Verfügbar unter https://www.gwk-bonn.de/fileadmin/Redaktion/Dokumente/Papers/NFDI.pdf.Search in Google Scholar

Hodson, Simon et al. (2018): Turning FAIR Data into Reality: Interim Report from the European Commission Expert Group on FAIR Data. Verfügbar unter https://doi.org/10.5281/zenodo.1285272.Search in Google Scholar

Mons, Barend et al. (2017): Cloudy, Increasingly FAIR; Revisiting the FAIR Data Guiding Principles for the European Open Science Cloud. In: Information Services & Use, 37 (1), 49–56. Verfügbar unter https://doi.org/10.3233/ISU-170824.10.3233/ISU-170824Search in Google Scholar

Muscella, Silvana et al. (2018): Prompting an EOSC in practice: final report and recommendations of the Commission 2nd High Level Expert Group on the European Open Science Cloud (EOSC). Luxembourg: European Commission. Verfügbar unter https://doi.org/10.2777/112658.Search in Google Scholar

Petras et al. (2019): Digitales Datenmanagement als Berufsfeld im Kontext der Data Literacy. In: ABI-Technik (erscheint).10.1515/abitech-2019-1005Search in Google Scholar

RfII – Rat für Informationsinfrastrukturen (2018): Zusammenarbeit als Chance. Zweiter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland. Verfügbar unterhttp://www.rfii.de/?wpdmdl=2529.Search in Google Scholar

RfII – Rat für Informationsinfrastrukturen (2018a): In der Breite und forschungsnah: Handlungsfähige Konsortien Dritter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland. Verfügbar unter http://www.rfii.de/?wpdmdl=3509.Search in Google Scholar

RfII – Rat für Informationsinfrastrukturen (2017a): Entwicklung von Forschungsdateninfrastrukturen im internationalen Vergleich. Bericht und Anregungen. Verfügbar unter http://www.rfii.de/?wpdmdl=2346.Search in Google Scholar

RfII – Rat für Informationsinfrastrukturen (2017): Schritt für Schritt – oder: Was bringt wer mit? Ein Diskussionsimpuls zu Zielstellung und Voraussetzungen für den Einstieg in die Nationale Forschungsdateninfrastruktur (NFDI). Diskussionspapier. Verfügbar unterhttp://www.rfii.de/?wpdmdl=2269.Search in Google Scholar

RfII – Rat für Informationsinfrastrukturen (2016): Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland. Verfügbar unter http://www.rfii.de/?p=1998.Search in Google Scholar

Schulte, Stephanie J. (2012): Embedded Academic Librarianship: A Review of the Literature. In: Evidence Based Library and Information Practice, 7 (4), 122–38. Verfügbar unter https://doi.org/10.18438/B8M60D.10.18438/B8M60DSearch in Google Scholar

Specht, Alison et al. (2015): Data management challenges in analysis and synthesis in the ecosystem sciences. In: Science of The Total Environment, Catalysing transdisciplinary synthesis in ecosystem science and management, (534),144–58. Verfügbar unter https://doi.org/10.1016/j.scitotenv.2015.03.092.10.1016/j.scitotenv.2015.03.092Search in Google Scholar

Tenopir, Carol et al. (2015): Changes in Data Sharing and Data Reuse Practices and Perceptions among Scientists Worldwide. In: PLOS ONE, 10 (8), e0134826. Verfügbar unter https://doi.org/10.1371/journal.pone.0134826.10.1371/journal.pone.0134826Search in Google Scholar

Teperek, Marta (2018): Data Stewardship – towards Cultural Change in Data Management. Verfügbar unter https://doi.org/10.5281/zenodo.1485805.Search in Google Scholar

Versweyveld, Leslie (2016): „We need 500.000 respected data stewards to operate the European Open Science Cloud -“. e-Infrastructures Reflection Group. Verfügbar unter http://e-irg.eu/news-blog/-/blogs/we-need-500-000-respected-data-stewards-to-operate-the-european-open-science-cloud.Search in Google Scholar

Whyte, Angus, und Ashley, Kevin (2017): D7.1: Skills landscape analysis and competence model. EOSCpilot: The European Open Science Cloud for Research Pilot Project. Verfügbar unter https://eoscpilot.eu/sites/default/files/eoscpilot-d7.1.pdf.Search in Google Scholar

Wilkinson, Mark D. et al. (2016): The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data 3. Verfügbar unter https://doi.org/10.1038/sdata.2016.18.Search in Google Scholar

York, Jeremy et al. (2018): What Do We Know about the Stewardship Gap. In: Data Science Journal, 17 (19). Verfügbar unter https://doi.org/10.5334/dsj-2018-019 .10.5334/dsj-2018-019Search in Google Scholar

Online erschienen: 2019-12-03
Erschienen im Druck: 2019-11-30

© 2019 Walter de Gruyter GmbH, Berlin/Boston

Downloaded on 3.12.2022 from frontend.live.degruyter.dgbricks.com/document/doi/10.1515/bfp-2019-2073/html
Scroll Up Arrow