Folge 45: Zugang zu Forschungsdaten
The Future is Open Science – Folge 45: Zugang zu Forschungsdaten
Dr. Doreen Siegfried
Leitung Marketing und Public Relations, ZBW – Leibniz-Informationszentrum Wirtschaft
Dr. Bernhard Miller
Koordinator KonsortSWD innerhalb der NFDI, GESIS – Leibniz-Institut für Sozialwissenschaften
[00:00:00] Intro
[00:00:02] Bernhard Miller:
Und wie man eben, wenn man von A nach B kommen möchte, vielleicht im echten Leben nicht laufen möchte, nimmt man einen Bus oder die S-Bahn, und dazu braucht man den Verkehrsdienstleister. Und in der wissenschaftlichen Infrastruktur sind wir so eine S-Bahn.
[00:00:24] Bernhard Miller:
Wir haben Zahlen, wonach Datensuche wie folgt funktioniert: 75 Prozent der Forschenden suchen über Literatur, knappe 60 Prozent googeln oder also benutzen Websuchmaschinen – aber das heißt im Regelfall ja Google. Und nur so ungefähr 41 Prozent benutzen fachspezifische Datenrepositorien.
[00:00:53] Bernhard Miller:
Ich teile auch die Einschätzung, dass gerade öffentliche Datenanbieter ihre Daten zur Verfügung stellen sollten.
[00:01:05] Doreen Siegfried:
73 Prozent der Wirtschaftsforschenden in Deutschland leiden, laut einer Umfrage des Vereins für Socialpolitik, am Zugang zu Forschungsdaten, und zwar an den strengen Restriktionen, an der mangelnde Benutzerfreundlichkeit und den vergleichsweise hohen Kosten, vor allem beim Zugang zu hochwertigen quantitativen oder gar qualitativen Daten, insbesondere zu Unternehmensdaten und amtlichen Statistiken. Doch wenn man mal genau guckt, lassen sich viele Forschungsfragen ohne umfassende Datengrundlagen heutzutage kaum noch beantworten. Wie kann also eine Infrastruktur aussehen, die Forschende hier unterstützt und gleichzeitig auch die sehr wichtigen datenschutzrechtlichen Anforderungen erfüllt? Und welche Rolle spielt die wissenschaftspolitische Arbeit, um langfristig geregelten Datenzugang zu schaffen? Diese Frage wollen wir heute beantworten.
Hallo und herzlich willkommen zu einer neuen Folge von „The Future is Open Science“, dem Podcast der ZBW. Mein Name ist Doreen Siegfried, und ich treffe mich hier mit ganz unterschiedlichen Leuten aus dem Wissenschaftsbetrieb, die Ihnen verraten, wie sie in ihrer täglichen Arbeit Open Science voranbringen. Und um diese Fragen zum Zugang zu Forschungsdaten heute näher zu beleuchten und vielleicht sogar eine Antwort zu finden, habe ich heute einen Wissenschaftsmanager eingeladen, der seit vier Jahren das Wirtschafts- und sozialwissenschaftliche Konsortium KonsortSWD innerhalb der Nationalen Forschungsdateninfrastruktur, kurz NFDI, koordiniert. Er arbeitet bei der GESIS und war nach seiner Promotion unter anderem beim Wissenschaftsrat tätig. Er bringt also umfassende Expertise in diesem Bereich mit. Herzlich Willkommen, Dr. Bernhard Miller!
[00:02:55] Bernhard Miller:
Hallo und danke für die Einladung.
[00:02:58] Doreen Siegfried:
Wir starten gleich mal rein. Wie erklärst Du Forschenden, die jetzt noch nichts, oder sagen wir nur wenig von der NFDI wissen, im Fahrstuhl oder auf einer Tagung beim Kaffee, was KonsortSWD eigentlich ist?
[00:03:12] Bernhard Miller:
KonsortSWD, würde ich antworten, arbeitet daran, die Arbeit mit Forschungsdaten zu verbessern. Und dabei umfasst das, was wir als Forschungsdatenmanagement bezeichnen, all die Schritte beim Umgang mit Daten in der Wissenschaft. Also von der Planung über den Zugang, hin bis zur Archivierung und wieder zur Nachnutzung. Dabei helfen wir.
[00:03:32] Doreen Siegfried:
Okay, alles klar. Du bist jetzt seit 2020 Koordinator bei KonsortSWD. Wie sieht denn so Dein typischer Tag aus in dieser Rolle, und welche Hauptaufgaben stehen da im Vordergrund?
[00:03:44] Bernhard Miller:
Über diese Frage habe ich tatsächlich ein bisschen nachdenken müssen. Sie ist… Es ist nämlich so, dass meine Tage erfreulich wenig eintönig sind und die NFDI eine sehr dynamische Umgebung ist. Aber dennoch gibt es natürlich typische Tage, an denen ich hauptsächlich Nachrichten lese und schreibe, und zwar mit Kolleginnen und Kollegen sowohl aus den Sozialwissenschaften. Da geht es dann hauptsächlich eher so um konkrete Fragen des Projektmanagements und der Projektorganisation. Aber dann treffe ich mich neben sozusagen den direkten fachlichen Kollegen und Kollegen auch noch mit sehr vielen Leuten, zum Beispiel aus den Tanzwissenschaften, aus den Erdsystemwissenschaften, und wir versuchen, gemeinsame Themen zu bearbeiten, die sozusagen über den engeren Bereich hinaus für alle Menschen, die mit Daten arbeiten, von Relevanz sind und für die wir versuchen, die Wege zu Lösungen zu ebnen.
[00:04:49] Doreen Siegfried:
Also, das heißt, Du bist ziemlich viel mit Leuten unterwegs und musst ziemlich viele Gespräche führe, mit Abstimmung und so weiter.
[00:04:55] Bernhard Miller:
Genau. Also, das ist gerade die Koordination, das sagt der Name meiner Tätigkeitsbeschreibung ja auch schon so ein bisschen, ist tatsächlich vor allem in das Gespräch kommen und dann auch die Formate finden, in denen man dann Inhalte weiterbringen und entwickeln kann. Und natürlich geht es auch darum, Ressourcen zur Verfügung zu stellen und zu finden. Aber all das sind sehr stark Themen, die im Austausch eben zwischen sehr vielen verschiedenen Leuten stattfinden.
[00:05:27] Doreen Siegfried:
Wie erklärst Du Leuten, die jetzt nicht in dieser NFDI-Landschaft sind oder auch gar nicht aus der Akademia kommen… Wie erklärst du denen die Institution Informationsinfrastrukturdienstleister oder generell Infrastrukturdienstleister?
[00:05:45] Bernhard Miller:
Also, das muss ich ja zugeben, ist ein Wort, das ich zu vermeiden versuche.
[00:05:49] Doreen Siegfried:
Sehr schön. [lacht]
[00:05:49] Bernhard Miller:
Aber ich würde sagen, das ist wie so im echten Leben ein Verkehrsdienstleister. Also, Forschende haben ja ein Erkenntnisinteresse, haben irgendwelche Fragen, die sie beantworten wollen, und je nachdem, was man für Fragen hat, macht das häufig keinen Sinn, das alleine zu machen. Und wie man eben, wenn man von A nach B kommen möchte, vielleicht im echten Leben nicht laufen möchte, nimmt man einen Bus oder die S-Bahn, und dazu braucht man den Verkehrsdienstleister. Und in der wissenschaftlichen Infrastruktur sind wir so eine S-Bahn. Also, zum Beispiel stellen… Also, etwas konkreter gedacht, ein Rechenzentrum oder ein Datenarchiv, also Hilfsmittel, die dazu beitragen, dass die Arbeit der Forschenden oder des Forschenden besser erledigt werden kann, schneller erledigt werden kann, umfassender erledigt werden kann. Und gewisser Weise ist ein Infrastrukturdienstleister also so eine Art Lebenserleichterer für Forschende.
[00:06:57] Doreen Siegfried:
Okay, Lebenserleichterer. Das nehmen wir doch mal mit. Sehr schön. Wenn wir nochmal auf die NFDI gucken. Noch ist es ja ein bisschen Zukunftsmusik für Forschende, die empirisch arbeiten und auch Support benötigen beim Forschungsdatenmanagement. Lass uns doch mal das Angebot von KonsortSWD ein bisschen detaillierter betrachten. Also wie unterstützt KonsortSWD speziell Forschende in den Wirtschaftswissenschaften? Welche Vorteile ergeben sich für die wirtschaftswissenschaftliche Forschung, wenn man mit KonsortSWD arbeitet?
[00:07:30] Bernhard Miller:
Ja, das ist, glaube ich, eine sehr wichtige Frage. Vielleicht kann ich vorwegschicken, dass ich denke, dass auch die NFDI, obwohl es sie jetzt erst im vierten Jahr gibt, schon doch ein relativ breites Angebot hat, das sich allerdings noch weiter rumsprechen muss. Also da gibt es was, und unter anderem eben bei KonsortSWD. Wir sind übrigens gerade dabei, uns in NFDI4Society oder das zumindest als weiteren Untertitel zu führen, um eben auch ein bisschen deutlicher zu machen, für welche Bereiche wir Dateninfrastruktur zur Verfügung stellen wollen. Also auch bei uns gibt es schon einiges, was wir bieten, und klar gerade speziell für Wirtschaftswissenschaftler:innen. Also zum Beispiel hattest Du ja in deinem Intro die sicherlich berechtigte Problematik angesprochen, dass es sehr schwierig ist, an Daten zu kommen, dass es Kosten gibt. Und ein Teil dieser Kosten ist häufig ja für diejenigen, gerade in den Wirtschaftswissenschaften auch, die mit sehr schützenswerten Daten arbeiten oder mit Daten von Unternehmen, also Daten aus privater Hand, zu denen die Zugangswege, sagen wir mal, asymmetrisch sind, also wo nicht jeder die gleichen Chancen hat. Und da gibt es jetzt zum Beispiel bei uns im Konsortium, in dem irgendwie annähernd 50 Institutionen vertreten sind, eben auch einige, die da große Expertise mitbringen. Und wir haben einen Dienst in Erarbeitung, der heißt Access to Firm Data und da werden Best Practices gesammelt und zur Verfügung gestellt. Also Tipps, wie man die Daten von privaten Datenhaltern eben oder wie man die davon überzeugt, Daten für Forschungszwecke bereitzustellen. Wie Repositorien sozusagen Verbindungen schaffen können, zum Beispiel mit privaten Datenhaltern, um eben auch Versionen von solchen Daten für Forschungszwecke dann der Forschung bereitzustellen. Also das ist, glaube ich, ein relativ konkreter Punkt, wo es uns darum geht, die Menge der verfügbaren Informationen gerade auch aus dem Sektor der privaten Wirtschaft zu erhöhen. Und dann…
[00:09:58] Doreen Siegfried:
Darf ich kurz unterbrechen?
[00:09:59] Bernhard Miller:
Na klar.
[00:09:59] Doreen Siegfried:
Das ist tatsächlich, wenn Du sagst, das sind Best Practices, also das heißt, das sind dann so Tipps und Tricks nach dem Motto: „Ruf mal da an, und wenn Du das und das sagst, dann kommst Du an die Daten ran, und wenn Du die Legitimation mitbringst, dann ist es nochmal einfacher.“ Also es sind so How to-Tutorials, oder wie muss man sich das vorstellen?
[00:10:17] Bernhard Miller:
Das auch. Zu einem geringeren Teil allerdings, weil die unterliegen ja einer gewissen Zufälligkeit. Aber es sind auch so Sachen wie Vertragsvorlagen und Hinweise darauf, wo das schon wie funktioniert. Also so Argumente, die durchaus auf einer etwas solideren Basis stehen. Und natürlich versuchen die entsprechenden Partner auch mit ihrer Reputation dann selber sozusagen weitere Daten aufzunehmen bei sich, um dann eben sozusagen… Also das ist sicherlich nichts, was jeder in gleichem Maße erfolgreich machen kann. Aber genau. Das ist eine Baustelle. Und weil man Menschen, die Daten für Geschäftszwecke erzeugen, nicht irgendwie anders dazu bringen kann, sie für die Forschung zur Verfügung zu stellen, ist da eben Überzeugungsarbeit gefragt. Und da gibt es Erfahrungswerte, die es sich eben lohnt, zu teilen. Also, das ist ein Aspekt. Der andere ist so ein bisschen technischer. Ich sprach das gerade schon an. Die Kosten, einfach an sensible Daten zu kommen. Vielleicht weiß das hier nicht jeder. Aber wenn ich zum Beispiel an die Daten zu Sozialleistungen der Bundesagentur für Arbeit dran möchte, dann kann ich die nicht zu Hause oder im Büro auf dem Rechner öffnen, sondern muss in sogenannte Safe Rooms, also spezielle Umgebungen, wo auch sichergestellt ist, dass ich mit diesen Daten kein Schindluder treibe. Und diese Räume sind halt zum Beispiel jetzt in Nürnberg oder an anderen Orten, wo Forschungsdaten zur Verfügung stehen. Und das ist natürlich schon ein erheblicher Aufwand. Vor allem, wenn ich da häufiger hin muss, um eine komplexere Analyse, sagen wir jetzt mal, für eine Promotion oder so, durchzuführen. Und was wir jetzt aufgebaut haben, das nennt sich RDC Net, das ist das Research Data Center Network. Das ist sozusagen eine Art des Fernzugangs, wo man eben nicht in die Safe Rooms der Forschungsdatenzentren muss, die diese Daten anbieten, sondern auch in die Safe Rooms aller anderen Forschungsdatenzentren kann. Und der mag vielleicht auch in der Stadt sein, oder viele, es gibt viele über Deutschland hinweg, in der Stadt sein, in der man gerade selber arbeitet und studiert. Und kann anstatt dessen eben vielleicht mit dem Rad fahren, und muss sich da nicht für mehrere Tage irgendwo anders hin begeben.
[00:12:35] Doreen Siegfried:
Ja, nochmal ganz kurz. Also es ist kein Remote-Zugang, wo ich sozusagen von Zuhause oder von meiner Uni aus mich in Nürnberg, München, sonst wo in Berlin einloggen kann, sondern ich muss schon noch irgendwo hinfahren?
[00:12:49] Bernhard Miller:
Genau. Also, es gibt… Insofern wird diese Klage, die Du am Anfang zitiert hast, so schnell nicht verschwinden. Es gibt einfach bei diesen Daten, die sehr wertvoll sind, eben Restriktionen, die man auch technisch nicht so problemlos aus dem Weg räumen kann. Und ein Problem ist eben, das teilweise vorgeschrieben ist, dass sich irgendjemand den Output anguckt, den man sozusagen mit nach Hause nimmt, um sicherzustellen, dass man keine vertraulichen Daten irgendwie für nicht Forschungszwecke oder auch für Forschungszwecke dann extrahiert. Und das kann man natürlich nicht sicherstellen, wenn das jemand in seinem eigenen Büro irgendwo an der Uni macht. Deswegen braucht man sozusagen Safe Rooms. Allerdings werden wir jetzt in der Weiterentwicklung dieses Projektes auch an einigen Universitäten dieses Netzwerk aufbauen, um sozusagen die Zugangshürden noch weiter zu senken. Also, das Ziel ist auf jeden Fall, und es gibt da eben auch schon die Erfolge, dass man eben hier den Forschenden den Aufwand stark reduziert, um an diese Daten ranzukommen.
[00:13:57] Doreen Siegfried:
Okay, also nochmal, weil das ist jetzt spannend für mich als Laien nochmal nachgefragt. Also das heißt, also mal angenommen, meine Daten, die ich gerne haben möchte, liegen in Nürnberg. Ich sitze in Kiel, muss ich jetzt nicht nach Nürnberg fahren, sondern ich weiß, es gibt, ich weiß, es gibt jetzt so einen SharePoint, so ein Netzwerkpunkt in Hamburg, wo mich dann jemand kontrolliert. Dann muss ich nur bis nach Hamburg fahren. Und da kann ich dann arbeiten und irgendein Forschungsdatenbeaufsichtiger guckt dann, ob ich da auch irgendwie keinen Blödsinn mit mache.
[00:14:31] Bernhard Miller:
Na ja, also… Genau. Das sind jetzt keine Forschungsdatenbeaufsichtiger. Aber das, was Du natürlich sozusagen dann mit nach Hause nimmst und was Du weiterverarbeitest, da guckt jemand drauf.
[00:14:40] Doreen Siegfried:
Ja, ja. Ja super.
[00:14:41] Bernhard Miller:
Genau. Dass da eben nicht drinsteht, dass Klaus Müller, geboren am 4. März, so und so viel Geld aus staatlichen Kassen bekommt, sondern dass Du von mir aus irgendwie nur Aussagen über die Menschen im Landkreis Kiel oder sonst irgendwas gesammelt mitnimmst.
[00:14:59] Doreen Siegfried:
Okay. Also, das heißt, diese ganzen Anfahrtswege, was ja durchaus ein Hindernis ist, sind dann auf jeden Fall kürzer. Das ist doch schon mal gut. Wenn wir mal auf die Forschungsfragen gucken, die sich so die Wirtschaftswissenschaften stellen, können jetzt durch die Infrastruktur von KonsortSWD irgendwie spezifische Forschungsfragen besser adressiert werden, als durch das, was es sowieso schon gibt? Also, gibt es zusätzliche Analysemöglichkeiten oder Verknüpfungen oder Zugangsmöglichkeiten, die nochmal besonders relevant sind für Wirtschaftsforscher:innen und vielleicht neue Fragen ermöglichen?
[00:15:36] Bernhard Miller:
Ich würde sagen, das wird sich zeigen. Also, wir machen zum Beispiel Daten besser findbar, und das heißt, wenn in irgendeinem klugen Kopf eine tolle Idee existiert, wird dieser kluge Kopf die entsprechenden Daten, die dafür benötigt sind, jetzt schneller finden. Ich bin mir nicht sicher, ob es Sinn machen würde, eine Infrastruktur so anzulegen, dass sie auf spezifische Forschungsfragen ausgerichtet ist, weil das gibt es einfach sehr, sehr viele und sehr, sehr vielfältige. Das ist nicht unser Ziel. Wir versuchen sozusagen, eine generelle Enabler-Struktur zu schaffen für alle, die mit bestimmten Arten von Daten arbeiten, und setzen sozusagen auf der allgemeineren Ebene an. Man möchte ja zum Beispiel, um dieses Verkehrsdienstleister-Beispiel nochmal aufzugreifen, auch nicht von vornherein sagen, dass Busse generell nur zu bestimmten Haltestellen fahren, auch wenn vielleicht irgendwo ein neuer Ort entsteht, an den man dann die Leute auch noch mal hinbringen möchte.
[00:16:37] Doreen Siegfried:
Ja, ich müsste die Frage…
[00:16:38] Bernhard Miller:
Ja.
[00:16:38] Doreen Siegfried:
Ich müsste die Frage vielleicht korrigieren. Also, ich meinte jetzt nicht, dass man plötzlich komplett neue Fragen in den Fokus rückt und andere Fragen ausklammert, sondern… Also die Frage, die mir durch den Kopf ging, ist, dadurch, dass ja sozusagen jetzt die NFDI ja auch Knoten ermöglicht oder Zugangswege zu anderen Daten, ob dadurch plötzlich ein neues Level erreicht werden kann für die Wirtschaftsforschung. Dass man sagen kann, okay, jetzt können wir auch mal nach links und rechts gucken und in anderen Bereichen nach Daten suchen und die verbinden miteinander.
[00:17:11] Bernhard Miller:
Also, da sind wir auf jeden Fall dran. Auch da ist es so ein bisschen die Frage tatsächlich, wo ich ein bisschen skeptisch bleibe, sozusagen: Wie sehen diese Use Cases eigentlich aus? Es gibt schon interdisziplinäre Zusammenarbeit, die man dann auch unterstützen kann. Aber, also zum Beispiel gibt es viele Arbeiten in den Sozial- und Wirtschaftswissenschaften, bei denen man sich gut vorstellen kann, dass sie zum Beispiel mit Erdbeobachtungsdaten, Satellitendaten irgendwie zusammenarbeiten. Und da kann man schon einiges machen und das unterstützen. Oder es gibt zum Beispiel aus dem Feld der Agrarforschung großes Interesse an der Zusammenarbeit mit uns und an sozialwirtschaftswissenschaftlichen Daten, um irgendwie zum Beispiel Landnutzung und ähnliches irgendwie sich angucken zu können, nicht nur in Deutschland, sondern auch international. Und die Frage… Also, was wir nicht versuchen in der NFDI, ist sozusagen global alle mögliche Verknüpfungen gleichzeitig anzugehen. Sondern wir suchen nach dem, was man da multidisciplinary use cases nennt. Also sozusagen konkrete Anwendungsfälle, die eben zum Beispiel nicht nur aus den Wirtschaftswissenschaften, sondern auch aus den Erdsystemwissenschaften mit ihren Beobachtungsdaten kommen. Um dann eine konkrete Lösung zu finden, wie man zum Beispiel für bestimmte Bereiche gut an Messdaten zu Umweltinformationen oder sowas rankommt, um dann auch zu erleichtern, die zum Beispiel gemeinsam in Datensätzen abzulegen oder die Datensätze miteinander zu verlinken, das dann auch bei der Nachnutzung es einfach wird, auf diese Daten zuzugreifen. Das erfolgt also an Beispielen. Und tatsächlich gibt es von denen schon welche. Aber wir sind momentan eher noch auf dem Punkt, wo wir uns zunächst mal um die Konsolidierung in unseren eigenen Disziplinen bemühen und noch nicht so viel Schwerpunkte auf die Zusammenarbeit zwischen verschiedenen Fächern legen. Das ist jetzt gerade massiv im Ausbau.
[00:19:12] Doreen Siegfried:
Ja, okay. Alles klar. Das heißt, wir reden dann in zwei Jahren vielleicht nochmal. [lacht] Wenn das…
[00:19:16] Bernhard Miller:
Ja. Das erscheint mir ein realistischer Zeitraum.
[00:19:19] Doreen Siegfried:
Alles klar. Du hast jetzt gerade schon das Thema international, global und so weiter angesprochen. KonsortSWD ist ja national ausgerichtet, also NFDI steht ja für nationale Forschungsdateninfrastruktur. Forschende in der Wirtschaftswissenschaft sind oft international vernetzt und recherchieren auch bei internationalen Anbieter nach Forschungsdaten, vor allem, wenn sie Schwierigkeiten haben, an deutsche Daten heranzukommen. Also wie stärkt KonsortSWD die Wettbewerbsfähigkeit der deutschen Wirtschaftsforschung, jetzt mal so im internationalen Vergleich? Kannst Du dazu was sagen?
[00:19:51] Bernhard Miller:
Also, ich finde das eine gute Frage und will vielleicht auch vorneweg schicken, dass ich irgendwie mit diesem N bei der NFDI irgendwie auch nicht wirklich glücklich bin. Im faktischen ist jede Forschungsdateninfrastruktur, genauso wie Forschung insgesamt, international. Das Ding hat das N vorne dranstehen, weil nationales Geld da reinfließt und man eben sozusagen das hier vor allem mit deutschen Institutionen aufbaut. Aber klar, logisch. Also, ich meine, nicht nur in den Wirtschaftswissenschaften brauchen wir internationale Daten, um… Nicht zuletzt, um einfach vielleicht mal zu gucken, ob Deutschland jetzt was ganz Besonderes ist oder ob es vergleichbare Trends auch woanders gibt. Wir sind also insofern, glaube ich, schon einfach auch insofern ein Beitrag zur Stärkung des Wissenschaftsstandorts Deutschland, weil wir hier Forschende an Einrichtungen hier zu Lande eben dabei unterstützen, besser mit Daten umzugehen. Was wir allerdings tatsächlich nicht machen, natürlich, ist zum Beispiel jemandem zu ermöglichen, an französische Sozialversicherungsdaten ranzukommen. Das geht nicht. Also insofern ist der Fokus gerade hier mit Blick auf die Sozial- und Wirtschaftsdaten schon ein deutscher. Und wir schließen uns zum Beispiel an internationale Metadatenstandards an. So dass also die Findbarkeit von Daten auch für jemanden jetzt aus Dänemark oder Schweden oder so gewährleistet ist. Aber natürlich können wir es den Forscherinnen und Forschern sicherlich nicht abnehmen, irgendwie, wenn sie internationale Projekte machen, auch in anderen Ländern entsprechende Daten dann zu suchen. Sofern die natürlich nicht irgendwie in Repositorien liegen, also wie das… Also die hier zu Lande dann eben sind und die dann, sozusagen, auch ein bisschen von uns mit abgedeckt werden.
[00:21:52] Doreen Siegfried:
Ja, okay. Nun bist Du ja sozusagen bei GESIS tätig, und es gibt GESIS mit ihren zahlreichen etablierten Dienstleistungen. Es gibt die zahlreichen Forschungsdatenzentren, die ja vom RatSWD akkreditiert sind. Die SOEP, das dürften viele kennen, das Sozio-oekonomische Panel, oder ALLBUS kennen natürlich auch viele und andere Konsortien der NFDI. Was würdest du sagen, was ist der USP? Also was ist das Alleinstellungsmerkmal von KonsortSWD, vor allem auch in Abgrenzung zu dem NFDI-Konsortium BERD? Also, wie kommunizierst du das an die Fachcommunity? Also, es gibt… die Landschaft ist breit und bunt. Was ist das besondere an KonsortSWD?
[00:22:39] Bernhard Miller:
Ja, also, ich weiß nicht. Ich komme jetzt hier sicherlich nicht als der beste Marketing Mensch rüber, weil ich würde tatsächlich sagen, das ist vielleicht auch gar nicht so sehr der Punkt, dass wir einen USP haben. Wir versuchen, dem Forschenden die Landschaft besser zu erschließen, und wir machen manche Sachen auch im Hintergrund, die… Klar, also auf diesem RDCnet, das ich eben ansprach, ist unser Logo drauf und auf anderen Sachen. Aber zunächst einmal ist es unser Anliegen, die bestehende Landschaft, die schon sehr vielfältig ist und viele Leistungen hat, besser zu erschließen. Also, es ist, glaube ich, noch nicht mal so sehr unser Ziel, dass jeder jetzt irgendwie sagt „Hey, KonsortSWD, habe ich schon mal gehört.“ Vielleicht sind wir auch ganz zufrieden, wenn wir einfach sehen, dass die Datennutzung, die Datenzitation oder sowas zunimmt, und man dann feststellt, dass auch bestimmte Dienste von uns eben in Anspruch genommen werden, die das erreichen. Also ich würde gar nicht so sehr sagen… Also unser USP, wenn man das so möchte, ist, eine Verbesserung einer existierenden Landschaft vorzunehmen durch eigene Produkte. Ja, aber eben auch dadurch, dass wir das, was andere Leute schon seit langem erfolgreich machen, einfach nochmal ins Schaufenster stellen und sagen, das ist da. Gleichzeitig hattest du auch die Frage zu BERD gestellt. In der Tat. Also, es gibt zum Beispiel vier Konsortien in den Geisteswissenschaften und zwei in den Sozialwissenschaften. Und sozusagen, das ist schon, könnte man jetzt sagen, eine relativ knappe Abdeckung, und deswegen haben wir tatsächlich eine klare Aufgabenteilung vereinbart und beschäftigen uns auf der Seite von KonsortSWD mit sogenannten strukturierten Daten, also allem, was so in Tabellenform aus Umfragen herkommt, Interviews beinhaltet. Und BERD hat einen Schwerpunkt auf unstrukturierten Daten und Algorithmen sozusagen. Also, da gibt es eine relativ klare Aufgabenteilung, sodass wir auch uns da nicht in die Quere kommen. Und wir verweisen auch die Kolleginnen und Kollegen, die jetzt mit einem Anliegen kommen, das eher im Bereich des anderen Konsortiums liegt, dann entsprechend weiter.
[00:25:08] Doreen Siegfried:
Okay. Das heißt jetzt also ─ ich muss noch mal als Laie nachfragen. Das heißt, es geht gar nicht so sehr darum, dass Ihr jetzt in Konkurrenz tretet zu dem, was es sowieso schon gibt. Sondern, wenn wir mal in dieser Verkehrsmetapher verbleiben, Ihr sorgt dafür, dass die Leute möglichst schnell von A nach B, nach C kommen. Und ob sie jetzt mit der S-Bahn fahren, mit dem ICE oder mit der Tram, ist erstmal Euch egal. Sie müssen nicht wissen, ich steige jetzt in die S-Bahn KonsortSWD. Hauptsache, sie bewegen sich möglichst schnell von A nach B, und es ist komfortabel.
[00:25:43] Bernhard Miller:
Genau. Also, das ist tatsächlich das Ziel der NFDI. Beim Rat für Informationsinfrastrukturen, der ja diese Idee geboren hat, heißt das irgendwie Stärkung des Vernetzungsgedankens. Man hat schon ziemlich viel. Gerade in den Sozialwissenschaften gibt es sehr leistungsfähige Infrastrukturen, die auch schon seit Jahren gut funktionieren. Aber nicht jeder weiß davon, und manchmal sind die Zugänge kompliziert. Da kann man noch verbessern. Da kann man neue Tools bereitstellen. Aber das ist sozusagen… Genau. Also, wir erleichtern den Umstieg, wenn man das Bild nochmal macht, von S-Bahn zum Bus, von irgendeinem anderen Anbieter. Genau.
[00:26:24] Doreen Siegfried:
Ja, okay. Wenn wir beim Thema Konkurrenz sind, dann die nächste Frage. Welche Rolle spielen denn eigentlich kommerzielle Anbieter als Supporter beim Forschungsdatenmanagement? Also ist das auch keine Konkurrenz, oder welche Rolle spielt das bei Euch?
[00:26:40] Bernhard Miller:
Es gibt viele Dienste, die wir anbieten, für die es keine Marktäquivalente gibt. Also insofern tatsächlich keine direkte Konkurrenz jetzt. Also, wenn wir Fernzugriffstools oder so was machen, da gibt es auch vieles, was im Open Source verfügbar ist und wo sozusagen wir jetzt nicht gegen kommerzielle Anbieter irgendwie antreten würden. Aber natürlich gibt es ja auch… Also wir kennen das Ganze aus der Diskussion im Publikationswesen, wo Verlage im Grunde genommen häufig dafür kritisiert werden, dass sie nochmal Geld dafür verdienen, dass sie Inhalte, die bereits mit Steuermitteln und mit viel Wissen und Einsatz aus der Wissenschaft produziert worden sind, nochmal als Geldquelle verwenden können. Und etwas Ähnliches passiert tatsächlich auch im Bereich von Daten. Wo Verlage zunehmend sich darum bemühen, Daten zu bekommen, zu hosten und auch Mehrwertdienste anbieten, was Erschließung angeht, um sozusagen es attraktiver zu machen, bei ihnen diese Sachen abzugeben. Natürlich mit dem Ziel, das zu monetarisieren zu einem gewissen Zeitpunkt. Insofern würde ich die Frage unter dieser Sicht schon beantworten mit einem ja. Also, es handelt sich hier um die gewisse Konkurrenzsituation, aber tatsächlich sozusagen zwischen allen öffentlichen Infrastrukturen und sozusagen denen, die in privater Hand sind. Und es ist ein Kernziel der NFDI ─ Stichwort digitale Souveränität ─ zu verstärken, dass man auch sozusagen solche wichtigen Leistungen für das Wissenschaftssystem eben selber organisiert und nicht riskiert, dass man dann irgendwie in ein paar Jahren in der Situation ist, wo man auch wieder zweimal zur Kasse gebeten wird. Also, da würde ich tatsächlich sagen, es ist nicht so ganz klar, wie dieses Spiel weitergeht und ausgeht. Ich würde sagen, wir sind momentan in einer ziemlich guten Situation, weil die öffentliche Infrastruktur beim Thema Daten, also Repos an Unis zum Beispiel, bei der ZBW, bei anderen Anbietern, natürlich schon eine große Leistungsfähigkeit haben. Aber natürlich schlafen die Verlage nicht und machen zunehmend attraktive Angebote. Da wird man sich sicherlich umschauen müssen, dass man sich da gut aufstellt.
[00:29:02] Doreen Siegfried:
Ja, okay. Das führt mich zur nächsten Frage. Von wegen attraktive Angebote machen und so weiter. Also, Du hast ja gesagt, KonsortSWD muss eigentlich gar nicht bekannt sein, also braucht eigentlich gar kein Marketing. Also ist es tatsächlich so, dass Ihr sagt, „Man muss uns gar nicht kennen. Hauptsache, man nutzt die Dienste, und wir sind so ein, so ein Untergrund, Hintergrunddienst.“ Oder anders gefragt, wie würdest Du diese Herausforderungen in Sachen KonsortSWD als neue Infrastruktur bekannt zu machen? Wie würdest du die benennen?
[00:29:40] Bernhard Miller:
Also, ich würde nicht sagen, dass wir nicht bekannt sein müssen. Wir wollen natürlich auch, dass die Leute auf unsere Homepage kommen, weil wir möchten ja auch unsere Dienste bekannt machen, und sozusagen, da sind wir gerne eben… Also möchten wir auch eingeladen werden und sozusagen Gelegenheiten haben, das vorzustellen. Also insofern, ich meine aber nicht sozusagen… Also, das vorher mit dem Blick auf das Alleinstellungsmerkmal war schon eher so zu verstehen gewesen, dass wir jetzt nicht versuchen müssen, heller zu leuchten als irgendwelche etablierten Angebote, wie das SOEP oder so was, weil das eben zusammengehört. Gleichzeitig stellen wir Mehrwerte bekannt, und wir machen auch Marketing für unseren Namen. Das ist ein Grund übrigens, warum wir uns auch diesen zusätzlichen Titel NFDI4Society gegeben haben, weil wir eben doch so ein bisschen das Feedback bekommen haben, dass sich unter KonsortSWD nicht alle Leute vorstellen können, für welchen Wissenschaftsbereich sie denn nun hier Angebote bekommen, weil alle anderen eben von NFDI4Bio Diversity über NFDI4Culture schon klarere Bezeichnungen haben, die zu mehr Leuten sprechen, was so im Angebotskatalog dann sozusagen steht.
[00:30:59] Doreen Siegfried:
Jetzt muss ich mal ketzerisch fragen: KonsortSWD ist eine Anhäufung von Buchstaben. NFDI auch. Was ist besser, wenn das jetzt heißt NFDI4Society? Es könnte ja auch…
[00:31:12] Bernhard Miller:
Na ja, bei NFDI4Society ist man sozusagen im Reigen von, ich glaube, 22 weiteren Konsortien, die mit dem Kürzel NFDI im Titel arbeiten. Und sozusagen bei vielen Leuten kann man dann, ich sag jetzt mal, so, Cross-Marketing-Effekte ernten. Also, wenn die eine NFDI kennen, dann suchen sie vielleicht nach einer anderen und verstehen eher, was das passiert. Und die NFDI als Ganzes ist natürlich auch eine zunehmende Größe im deutschen Wissenschaftssystem. Also, es gibt eine Umfrage des DZHW jetzt aus dem Frühjahr diesen Jahres, wo immerhin ein knappes Drittel von der NFDI schon mal gehört hatten. So, das ist jetzt nicht super viel, aber es ist auch mehr, als man sozusagen an anderer Stelle nach ein paar Jahren Arbeit irgendwie erwarten würde. Insofern kann man natürlich davon profitieren, wenn man sozusagen das NFDI-Label als Ganzes bekannter macht und sich als Untermarke für die Sozialwissenschaften hier dann positioniert.
[00:32:27] Doreen Siegfried:
Ja gut, dann würden mich mal Ergebnisse interessieren, ob tatsächlich NFDI4Society, ob das so, ob das ankommt, ob das Leute verstehen?
[00:32:36] Bernhard Miller:
Auch das können wir bei unserem Gespräch in zwei Jahren gerne wieder aufgreifen.
[00:32:40] Doreen Siegfried:
Welche Rolle spielt denn eigentlich ─ also, wir bleiben mal beim Thema Vermarktung und so weiter. Welche Rolle spielt denn die klassische Suchmaschinenoptimierung? Also googeln Wirtschaftsforschende nach Forschungsdaten? Und wenn ja, ist KonsortSWD suchmaschinenoptimiert?
[00:32:59] Bernhard Miller:
Ja und ja.
[00:33:00] Doreen Siegfried:
[lacht] Ja und ja.
[00:33:01] Bernhard Miller:
Alle googeln. Wir haben Zahlen, wonach Datensuche wie folgt funktioniert: 75 Prozent der Forschenden suchen über Literatur. Knappe 60 Prozent googeln oder also benutzen Websuchmaschinen. Aber das heißt im Regelfall ja Google. Und nur so ungefähr 41 Prozent benutzen fachspezifische Datenrepositorien. Und das sind vermutlich auch andere Gruppen, weil wenn ich weiß, welches Repo ich verwenden muss, dann weiß ich schon viel, viel mehr. Das heißt, gerade als Einstiegsaktivität sind Websuchmaschinen ein sehr niedrigschwelliger Zugang zu Forschungsdaten. Wir machen systematisch eine Unterstützung von Search Engine Optimization, damit man eben zum Beispiel, gerade wenn man ─ wir waren ja gerade bei Akronymen ─ irgendwie mit dem SOEP oder mit dem ALLBUS nicht so wahnsinnig viel anfangen kann, dass eben dann auch die Daten so beschrieben sind in einer Suchmaschinen zugänglichen Form, dass man mit den Inhalten, die einen mutmaßlich interessieren, auch diese wichtigen Datensätze finden kann.
[00:34:11] Doreen Siegfried:
Ja, okay. Ja super. Ich würde gerne nochmal auf das Thema Umgang mit sensiblen Daten zu sprechen kommen. Also, das ist ja gerade im Bereich der Sozialwissenschaften ein ganz wichtiges Thema. Wie unterstützt KonsortSWD denn Forschende oder auch Forschungsdatenzentren konkret bei der Verwaltung sensibler Daten? Also, welche technischen oder inhaltlichen Hilfestellungen gibt es, um den Umgang mit diesen Daten zu erleichtern? Also, gibt es sowas wie einen Anonymisierungsservice oder sowas? Was könnt Ihr da anbieten?
[00:34:43] Bernhard Miller:
Also, zunächst mal sind Forschungsdatenzentren, davon gibt es derzeit 41, tatsächlich die Expert:innen im Umgang mit ihren jeweiligen sensiblen Daten. Die müssen wir dabei nicht unterstützen. Im Gegenteil, deren Expertise geben wir weiter an Menschen, die eben, sagen wir mal, jetzt in dem Forschungsprojektkontext auch eine Anonymisierungs- oder Daten-Pseudonymisierungsaufgabenstellung haben. Und, ja, es gibt auch Unterstützungstools. Also einmal beraten wir, vermitteln die Expertise weiter. Und dann gibt es zum Beispiel im Bereich qualitativer Daten, die ja in den Wirtschaftswissenschaften auch eine wichtige Rolle spielen… Übrigens haben wir jetzt unlängst Zahlen eingesammelt, die darauf hindeuten, dass das so ungefähr ein Drittel ist. Das ist relativ viel. Und da gibt es zum Beispiel eben ein Tool, das es erlaubt… ─ QualiAnon heißt das ─ ist hauptsächlich im soziologischen Kontext entstanden, aber sozusagen von der technologischen Basis her auch für alle anderen Fragestellungen einsetzbar, das eben es erlaubt, aus Interviewtexten bestimmte Informationen umzuwandeln. Also zum Beispiel Altersangaben irgendwie von einem konkreten Alter in irgendwas in seinen Vierzigern umzuwandeln, anstelle eben irgendwas Konkretes zu machen und auf die Art und Weise eben dann eine Nachnutzbarkeit von solchen Daten, von solchen Interviewdaten, zu ermöglichen. Obwohl da ja eine große Menge an hochgradig personalisierbaren Informationen drin sein können.
[00:36:33] Doreen Siegfried:
Okay.
[00:36:34] Bernhard Miller:
Also, ja.
[00:36:35] Doreen Siegfried:
Das heißt, das Tool heißt QualiAnon. Können wir ja in die Shownotes packen, den Link dazu…
[00:36:39] Bernhard Miller:
Sehr gerne.
[00:36:40] Doreen Siegfried:
…dass man da drauf kommt. Und vielleicht hast du ja sonst auch noch weitere Links und so weiter, die ganz hilfreich sind, wenn es um das konkrete Doing geht bei der Anonymisierung. Die Nachnutzung sensibler Daten erfordert natürlich auch auf besondere Vorkehrungen und Genehmigung. Also wie stellt KonsortSWD sicher, dass solche Daten in Übereinstimmung mit rechtlichen und ethischen Vorgaben zugänglich gemacht werden können?
[00:37:07] Bernhard Miller:
Also, wir akzeptieren in den Forschungsdatenzentren für die Freigabe an andere nur faktisch anonymisierte oder pseudonymisierte Daten. Und das wird fallspezifisch kontrolliert. Also, da schaut man sich dann eben auch an, wird auch durchprobiert, ob man gegebenenfalls Deanonymisierungsstrategien irgendwie fahren könnte. Und dann, wenn wir sozusagen in den Forschungsdatenzentren Zugang zu tatsächlich Daten bieten, die eben sehr direkt personenbezogene Informationen bieten, dann wird dann eben durch die bereits angesprochene Outputkontrolle sichergestellt, dass das, was dann mitgenommen wird, auch diesen Ansprüchen entspricht. Das ist ein sehr, sehr aufwendiger Prozess, der im Forschungsprozess sicher belastbar ist, belastend ist und gleichzeitig aber natürlich auch notwendig, um die Glaubwürdigkeit gegenüber den Menschen eben zu bewahren, dass Forschung ein Interesse zwar an den Erkenntnissen hat, aber natürlich auch ihre Privatsphäre, ihre eigenen Daten, respektiert. Das ist, glaube ich, was, was man immer vergisst. Wir haben sehr viele Menschen, die über die DSGVO und andere Vorgaben sich beschweren, weil es eben ein Problem ist. Aber gleichzeitig ist eben schon die Frage, ob man das nicht den Menschen auch bis zu einem wichtigen Punkt schuldig ist. Und ich glaube, die Forschenden verstehen das. Das ist der Punkt mit der Ethik. Das sind natürlich sehr viel weichere Regeln, die nirgends klar kodifiziert sind. Aber da spielt das natürlich auch eine große Rolle, dass man sich einfach im Klaren ist, dass Forschung nur dann funktioniert, wenn die Menschen auch darin vertrauen, dass solche Daten verantwortungsvoll behandelt werden.
[00:39:05] Doreen Siegfried:
Ja, auf jeden Fall. Gehen wir nochmal kurz auf das Thema Zusammenarbeit, Vernetzung innerhalb der NFDI. Vielleicht auch auf europäischer Ebene. Also, Du hast ja gesagt, es gibt verschiedene Konsortien. KonsortSWD ist eng vernetzt mit den anderen 25 und auch mit dem NFDI-Direktorium. Wie gestaltet sich hier eigentlich die Zusammenarbeit und die Kommunikation zwischen den verschiedenen Akteuren in der NFDI? Also was sind so die gemeinsamen strategischen Leitlinien?
[00:39:35] Bernhard Miller:
Also, die NFDI verfolgt ein gemeinsames Ziel, eben Daten sozusagen als Gemeingut möglichst gut verfügbar zu machen. Das ist sehr stark angelehnt an die Idee von Open Science. Und es gibt in der NFDI übergreifend wirklich ein absolut beeindruckendes Engagement. Das habe ich auch in meinen anderen Arbeitsbereichen, in denen ich zuvor tätig war, in dieser Form nicht erlebt. Das macht sehr viel Spaß, weil die Leute alle daran glauben, dass man eben mit einem besseren Datenzugang und mit besseren Daten wirklich auch die Wissenschaft stark voranbringen kann. Es ist eben in der Zusammenarbeit also sehr stark gleichzeitig von diesem Bottom-up-Ansatz geprägt, dass man eben versucht, die Lösungen zu finden für die Probleme, die in den Forschungscommunities am dringendsten sind. Deswegen ist das für uns zum Beispiel auch total wichtig, dass man uns einfach auch anfunkt und sagt, bitte, kümmert euch mal um das und das. Viele Sachen haben wir auf dem Schirm und manche ganz sicher auch nicht. Und was die strategischen Ziele angeht in der NFDI: es gibt eine Strategie und drei wesentliche Punkte aus der sind sozusagen ein, also mit durch ein abgestimmtes Trainingsangebot sozusagen den Wissensstand zum Forschungsdatenmanagement an möglichst vielen Punkten zu verbessern und ein Qualitätslevel zu erreichen. Dann die Zusammenarbeit zwischen den Konsortien zu stärken. Das ist mehr so ein interner Punkt. Und dann, ganz, ganz wichtig, eben ein Dienste-Portfolio aufzubauen. Das heißt, irgendwie dann mal die Website, auf der man sieht, für jenes Problem in jenem Wissenschaftsbereich, gibt es hier einen technischen Dienst, oder gibt es hier ein Beratungsangebot oder irgendwelche best practice Empfehlungen, die ich nutzen kann, um meine eigene Forschung voranzubringen.
[00:41:37] Doreen Siegfried:
Okay. Aber es gibt nicht jetzt irgendwie so eine Vorgabe, so fertige Templates, nach dem Motto: jedes Konsortium muss irgendwie auf der Webseite Trainings anbieten und dann auch noch irgendwie einen Zugang und einen Datenservice und einen Beratungsservice und so weiter, sondern das entwickelt jedes Konsortium sozusagen für die Community selbst.
[00:42:00] Bernhard Miller:
Ja. Die Konsortien sind ja von der DFG gefördert. Und zum Beispiel zum Thema Training haben alle Konsortien Angebote, die aber, die sind aber durchaus unterschiedlich aufgestellt. Gleichzeitig konvergiert das Ganze. Also wir haben zum Beispiel die Idee eines Helpdesks, gebe ich ganz offen zu, von anderen abgeguckt, weil das bei denen gut funktioniert hat und weil da viele interessante Sachen passieren. Und ähnlich gibt es auch andere Bewegungen, zum Beispiel zum Thema Suchmaschinenoptimierung. Das sind Aspekte, die in anderen Konsortien jetzt wiederum nicht so eine große Rolle gespielt haben, die aber durchaus auch angekommen sind. Und insofern denke ich schon, dass es in einiger Zeit ein Kernangebot eines NFDI-Konsortiums geben wird, das zwischen verschiedenen Bereichen grob vergleichbar ist. Aber dann haben die Tanzwissenschaften halt schon auch andere Bedürfnisse als die Astrophysiker: innen.
[00:43:00] Doreen Siegfried:
Ja, klar, das ist klar. Und was ist Deine Einschätzung? Wird es sozusagen, wenn die NFDI fertig ist, also wird es dann am Ende eine NFDI geben, oder werden es mehrere fachlich geclusterte NFDISs, die halt auch vielleicht auch unterschiedliche Geschwindigkeiten haben?
[00:43:19] Bernhard Miller:
Also, ich glaube, es gibt jetzt schon eine NFDI. Das ist so ein bisschen so eine formale Antwort. Es gibt diesen Verein mit Sitz in Karlsruhe, der gewisse Dachfunktionen bereitstellt. Unter diesem Dach koordinieren wir uns alle und entwickeln eine eigene, entwickeln eine gemeinsame Strategie, eine gemeinsame Richtung. Aber ja, ich glaube auch, dass es innerhalb sozusagen dieser einen NFDI unterschiedliche Angebote und auch unterschiedliche Geschwindigkeiten geben wird. Und es gibt ja auch noch eine ganz andere Frage, dass es auch… Also, ob wirklich jetzt schon mit 26 Konsortien das gesamte deutsche Wissenschaftssystem in der NFDI abgedeckt ist. Da wird man sicherlich auch sagen müssen, dass es auch neue Bereiche gibt, die sich gerade erst entwickeln, fachlich auch in verschiedenen Fächern, und die vielleicht da auch mal einen Platz bekommen müssen. Und klar, das sind dann… Da wird es auf jeden Fall unterschiedliche Geschwindigkeit geben. Das ist auch jetzt schon so. Die NFDI sind drei Runden ausgewählt worden. Einige Konsortien sind jetzt erst seit März 2023 dabei. Die profitieren zwar von dem, was die anderen vor ihnen schon gemacht haben, aber natürlich ist man in diesen Bereichen dann auch noch nicht da, wo diejenigen sind, die jetzt eben irgendwie schon seit vier Jahren dabei sind.
[00:44:39] Doreen Siegfried:
Und wenn wir mal international gucken, wie wird denn KonsortSWD sich dieser EOSC-Drehscheibe, also dem Knotenpunkt der European Open Science Cloud anschließen?
[00:44:54] Bernhard Miller:
Also ich muss tatsächlich sagen, ich war total begeistert, als ich irgendwie… Ich habe letzte Woche mir auf dem EOSC-Node ein Konto bei deren Nextcloud, also einfach dem simplen Daten Sharing Service, angemacht. Und ein Kollege aus Mainz hat bereits auf dem EOSC-Node ein scripted hosting für eine gemeinsame in der NFDI geteilte Datenbank irgendwie testweise aufgesetzt. Also, es gibt da auf jeden Fall Funktionen, mit denen der Node ─ und der ist ja noch verdammt jung…
[00:45:30] Doreen Siegfried:
Ja klar. Der ist glaube ich eine Woche alt oder zwei.
[00:45:33] Bernhard Miller:
Genau. Also seit knapp zwei Wochen weiß man das, wie das unterstützen wird. Gleichzeitig, also, ich glaube schon, dass man das Forschenden in den Wirtschaftswissenschaften auch anbieten kann, als Lösung. Gerade vielleicht auch wenn sie in international kollaborativen Projekten sind, mag das eine gute Lösung sein. Ob man jetzt als Konsortium sozusagen komplett irgendwie auf den EOSC-Node Dienste sich umstellen wird, das werden wir uns anschauen und das diskutieren. Also dafür ist das einfach tatsächlich noch viel zu früh, um das zu beurteilen. Weil gerade so Fragen der IT-Beschaffung, das kann an Universitäten und Instituten… Also so Prozesse auf neue Akteure auszurichten, das ist nichts, was sich innerhalb kurzer Zeit vernünftig diskutieren und entscheiden lässt. Also da braucht man, glaube ich, auch noch ein bisschen Geduld.
[00:46:32] Doreen Siegfried:
Ja, okay. Ja, das kennen wir alle. So was will gründlich vorbereitet werden. Okay. Welche Rolle spielt denn bei KonsortSWD, oder vielleicht auch generell in der NFDI, die wissenschaftspolitische Arbeit? Also, ist es denn beispielsweise angedacht, die Aufsichtsbehörden der statistischen Ämter oder den Gesetzgeber zu überzeugen, den Datenservice für die Forschung kostenlos oder vielleicht gegen eine geringe Gebühr bereitzustellen? Das ist ja was, was viele, das, was ich am Anfang sagte, was ja viele Forschende stört, dass es unglaublich kompliziert ist und dass Daten, die sowieso von den statistischen Ämtern erhoben werden, dann wiederum nicht zugänglich sind oder nur gegen viele Kosten. Also gehört das auch zum Teil Deiner Arbeit oder auch zum Teil der NFDI-Arbeit, hier die Rahmenbedingungen zu ändern?
[00:47:23] Bernhard Miller:
Also, lass uns das mal als zwei Fragen betrachten. Ich fange jetzt tatsächlich mal mit der mit den Kosten an. Also es gab ja jetzt in jüngerer Zeit diese Diskussion über Gebühren gerade bei den Statistischen Ämtern, und wenn man das nachliest, stellt man ja auch fest, dass der wissenschaftliche Beirat just jener Ämter selber die Entscheidung stark kritisiert hat, dass da Gebühren erhoben werden sollen. Und im Grunde genommen wollen die Akteure, die diese Daten haben, sicher auch, dass sie gut genutzt werden und finden Hürden, die sozusagen den Nutzenden in den Weg gelegt werden, schlecht. Das sind Vorgaben. Genau deswegen fragst du ja auch nach politischer Lobbyarbeit. Es gehört aber halt auch zu der Wahrheit, dass eine Tabelle, die das Bundesamt oder irgendwie ein anderer Datenanbieter auf seiner Homepage hat, nichts kostet ab einem gewissen Zeitpunkt. Dass aber, wenn man für ein spezielles Forschungsprojekt Daten eben zusammensuchen muss, kombinieren, Leute dabei unterstützen und beraten muss, dass das natürlich schon unterschiedlich Aufwand betrachtet. Und ich würde hier gerade tatsächlich auch mal in die wirtschaftswissenschaftliche Community argumentieren wollen, dass man für diesen Aufwand natürlich…, dass man das anerkennen muss. Und insofern glaube ich schon, dass wir uns darauf einstellen sollten, das in Zeiten, wo die Finanzierung aus öffentlicher Hand knapp wird, man gucken muss, dass es faire Preismodelle gibt. Ich glaube, darauf müssen wir hin, dass also tatsächlich jemand, der ganz, ganz viel Aufwand erzeugt, vielleicht dafür auch zur Kasse gebeten wird. Und jemand, der normalen Aufwand erzeugt, vielleicht das Ganze weiterhin oder kostenlos bekommen soll. Auch, weil, wenn man viel Aufwand erzeugt, man ja vielfach vielleicht auch ein Forschungsprojekt in der Hinterhand hat, bei dem man, wenn man das klug plant, Gelder für solche Arbeiten bereits eingeworben hat und insofern faktisch nichts zahlen muss. Das ist, glaube ich, schon so, dass man das einfach auch mit in den Prozess mit reindenken soll. Nichts destotrotz, die politische Arbeit ist total wichtig. Ich glaube auch, wir müssen Werbung dafür machen, dass Forschung möglichst viel, möglichst breiten und möglichst einfachen und kostenlosen Zugang zu Daten erhält. Und gerade KonsortSWD, SWD kommt ja vom Rat für Sozial- und Wirtschaftsdaten, der Teil unseres Konsortiums ist und der ein ganz, ganz wichtiger Player in dieser Landschaft ist und der sich tatsächlich auch zum Beispiel in diese Debatte um diese Preisstrukturen bei den statistischen Ämtern eingeschaltet hat und eben auch ein entsprechendes Plädoyer abgegeben hat, dass das kostenlos läuft. Also, ich denke, das sind zwei verschiedene Sachen. Einerseits auf der politischen Ebene Verständnis und Werbung dafür machen, dass man den Nutzen von Wissenschaft in der Analyse von Daten nur dann kriegen kann, wenn das möglichst niederschwellig passiert. Gleichzeitig aber vielleicht dann doch auch bei der Planung der eigenen Projekte mit Kosten irgendwie rechnen, sofern sie denn anfallen, und die einfach einwerben. Das ist in den allermeisten Fällen kein Problem und sollte für viele Projekte, gerade die größeren, eigentlich eine erledigbare, einfache Aufgabe sein. Die NFDI als Ganzes, vielleicht noch dieser letzte Punkt, hat nicht den Auftrag, gemäß ihrer Satzung, irgendwie Politikberatung oder sowas zu machen. Gleichwohl stellt sich raus, dass das an vielen Stellen, dass diese Expertise gewünscht ist, und auch der NFDI-Verein steht im Lobbyregister drin. Wobei ich persönlich schon halbwegs unglücklich damit bin, dass man sozusagen, wenn man wissenschaftliche Expertise oder auch Datenexpertise der Politik zur Verfügung stellt, dass man dann irgendwie unter der Fahne eines Lobbyisten oder einer Lobbyistin fährt, weil vielfach ist das ja tatsächlich inhaltliche Expertise, die die Politik ja auch aktiv anfragt.
[00:51:36] Doreen Siegfried:
Ja. ich frag natürlich vor dem Hintergrund, weil, als die NFDI gestartet ist, gab es ja sozusagen diese ganzen, diese ganzen Feedbackgespräche mit der Community noch nicht. Also das heißt, jetzt, ein paar Jahre später, weiß man ja, was die Community braucht. Und selbst, wenn das vielleicht zum Anfang noch nicht in der Satzung stand, könnte es ja sozusagen eine Folge sein der Arbeit, das man feststellt, also, wir brauchen… Die schönste technische Infrastruktur, nutzt wenig oder ist nur der halbe Spaß, wenn nicht die Rahmenbedingungen entsprechend sind. Und man könnte ja beispielsweise auch sagen bei den statistischen Bundesämtern: Warum nehmen die da Geld für? Die könnten doch einfach sagen, das gehört zu unserem Jobprofil, dass wir hier auch die Forschung unterstützen, und Aufwand ist halt Aufwand. Aber man kann sagen, „Okay, das gehört zu unserer, zu unserer Arbeit dazu.“
[00:52:32] Bernhard Miller:
Genau.
[00:52:32] Doreen Siegfried:
Also, so könnte man das ja auch denken und sagen: Ja, okay. Das kostet jetzt Arbeit. Aber das ist halt, ich mein, alles ist Arbeit. Dann können wir auch sagen: Wozu seid ihr da? Die Forschung zu unterstützen, ist halt auch notwendig.
[00:52:50] Bernhard Miller:
Also absolut. Wie gesagt, ich bin auch… Also, wir machen das. Der RatSWD macht das. Ich halte das für eine wichtige Richtung. Ich teile auch die Einschätzung, dass gerade öffentliche Datenanbieter ihre Daten zur Verfügung stellen sollten. Gleichzeitig ist es halt auch bei denen so: Die haben eine begrenzte Anzahl von Ressourcen, und wenn sie alle Anfragen beantworten, finde ich es fairer, wenn die, die einfache Anfragen stellen, kostenlos an die Daten kommen und die, die super komplizierte Anfragen stellen, bevor sie jetzt das ganze System für zwei Monate verstopfen, eben vielleicht, sozusagen, das auch finanzieren. Das ist, glaube ich, mit Blick auf den Gesamtoutput an wissenschaftlichem Nutzen, den wir aus der Datennutzung kriegen, dann der bessere Deal.
[00:53:35] Doreen Siegfried:
Ja, auf jeden Fall braucht man da Fairness. Da stimme ich dir absolut zu. Wie sieht denn KonsortSWD seine Rolle in der wissenschaftspolitischen Diskussion um die Einführung gesetzlicher Datenzugangsansprüche, also sogenannter Forschungsklauseln? Und ─ Du hast jetzt gesagt, okay, durch den RatSWD ist da eigentlich auch schon ein Fuß in der Tür, wenn nicht zwei ─ wurden Schritte unternommen, um diese Einführung zu unterstützen? Also, was denkst Du zu dem geplanten Forschungsdatengesetz?
[00:54:02] Bernhard Miller:
Ja, genau das gehört zusammen. Also die Forschungsklauseln sind ein ganz, ganz wichtiger Schritt. Die Wissenschaft braucht einen anderen Zugang zu Daten, als das andere Gruppen in der Gesellschaft brauchen, und die Gesellschaft profitiert auch davon, dass Wissenschaftler:Innen diesen Zugang zu den Daten haben. Deswegen unterstützt die gesamte NFDI und auch der RatSWD und KonsortSWD diese Bemühungen um Forschungsklauseln, die ja tatsächlich auch in den so semiinformellen Entwürfen des Forschungsdatengesetzes enthalten sind und die derzeit kursieren. Also, ich halte das für eine wirklich zentrale Voraussetzung, dass man hier eine ─ andere Leute sprechen von Forschungsprivileg ─ also, dass man da sozusagen verbesserte Zugangsbedingungen, gerade zu besonders wichtigen Daten, gesetzlich verankert. Das spricht ja dann auch zu der Frage von vorhin, weil dann natürlich klar wird, dass man entsprechende Zugänge auch vielleicht entsprechend fördern muss, dann von Seite der Daten haltenden Institutionen. Das Forschungsdatengesetz insgesamt ist ja im Koalitionsvertrag angekündigt gewesen und sicherlich von vielen Leuten sehr stark erwartet worden. Ich glaube, dass eben, weil du mich nach meiner Meinung zum Forschungsdatengesetz gefragt hast, insgesamt das ein sehr, sehr wichtiger Schritt, und jetzt benutze ich den Konjunktiv, wäre. Weil der eben in der Wissenschaft gut abgesprochen und diskutiert werden muss, und da bin ich mir tatsächlich derzeit einfach nicht sicher. Die Bundesregierung hat mit sehr vielen Herausforderungen zu kämpfen derzeit. Ich bin mir nicht sicher, ob ein Gesetz, das jetzt zu einem relativ späten Zeitpunkt erst so langsam das Licht des offiziellen Gesetzgebungsprozesses erblickt, all die Erwartungen, die wir als Forschung in es haben, wird erfüllen können. Und das wäre sehr schade, wenn sozusagen, dass jetzt irgendwie auch aufgrund der zeitlichen Dimension und weil viele Sachen da jetzt noch nicht gut diskutiert worden sind, unter die Räder käme.
[00:56:29] Doreen Siegfried:
Ja, also vielleicht für unsere Zuhörer:innen. Wir sprechen heute am 6. November. Es ist früher Morgen, und wer weiß, wie heute Abend die Bundesregierung aufgestellt ist. Insofern müssen wir wahrscheinlich etwas pessimistisch auf das Thema Forschungsdatengesetz schauen.
[00:56:48] Bernhard Miller:
Wobei wir das Thema Forschungsdatengesetz, glaube ich, als wissenschaftliche Community auch in dem Fall hochhalten sollten, dass es jetzt nicht mehr unter der gegenwärtigen Regierung sozusagen ein Erfolgsfall wird. Es gibt Menschen, die glauben, das Thema sei verbrannt, wenn es jetzt nicht durchkommt. Ich glaube, die Relevanz bleibt erhalten. Und die Argumente, die wir jetzt präsentieren, die sind im Zweifelsfall auch in einem Jahr oder in zwei Jahren noch genauso relevant. Und ich denke, das ist auch gut vermittelbar, dass man für Forschung, wenn man sozusagen auch Policies weiterentwickeln möchte, einfach gute Zugänge braucht zu relevanten Daten.
[00:57:30] Doreen Siegfried:
Ja, okay. Das ist natürlich ein guter Punkt. Vielleicht noch eine Frage zu diesem ganzen wissenschaftspolitischen Thema. Also der RfII-Bericht, also RfII ─ Rat für Informationsinfrastrukturen ─ vom Juni 2023 schlägt so Datentreuhandmodelle vor, als zentrale Elemente für besseren Datenzugang. Welche Rolle sieht KonsortSWD hier im speziellen und die NFDI vielleicht generell in der Entwicklung solcher Treuhandstrukturen?
[00:57:57] Bernhard Miller:
Also…
[00:57:58] Doreen Siegfried:
Und wie könnten diese konkret vielleicht auch die Datenverfügbarkeit für Forschende verbessern?
[00:58:03] Bernhard Miller:
Also, vielleicht jetzt gerade auch für die Zuhörer:innen: so ein Datentreuhänder:in ist eine Einrichtung, die eben sozusagen zwischen jemandem, der vertrauliche Daten hat oder auch privat, also kommerzielle Daten, und dem Nutzer. Und die Institution ist dann im Zweifelsfall in der Lage, die Daten zu anonymisieren oder bestimmte Informationen rauszunehmen, sodass sie dann besser genutzt werden können, und ist da sozusagen so eine Verbindungsstelle. Insofern, weil ich das gerade inhaltlich schon so ein bisschen beschrieben habe, das ist natürlich gerade bei den Daten, von denen wir reden, gerade auch vor dem Hintergrund, dass sich viele in der Wirtschaftswissenschaft auch Zugang zu den privat gehaltenen Daten oder Daten aus der Wirtschaft wünschen, ein sehr, sehr wichtiges Element, wenn ich das richtig verstehe. Das ist jetzt nicht mein Spezialgebiet, und der RatSWD hat aktuell eine Arbeitsgruppe zu diesem Thema. Am Laufenden gibt es halt sehr viele unterschiedliche Verständnisse davon, was so eine Datentreuhandstelle sein und tun sollte. Es gibt auch eine Diskussion darüber, ob die Forschungsdatenzentren, wie sie bei uns unter dem Schirm sind, vielleicht auch als Datentreuhandstellen verstanden werden können. Aber da ist noch einiges im Flux. Insgesamt, glaube ich, brauchen wir sowas und wir sollten gucken, dass wir da vorankommen. Auch das Forschungsdatengesetz übrigens in seinem aktuellen Entwurf sieht eine ziemlich massive Datentreuhandstelle vor, die Deutsches Zentrum für Mikrodaten heißen würde und also ähnliche Funktionen praktisch dann übernehmen würde. Also, ich glaube, da gibt es einen stabilen Konsens, dass man sowas braucht. Aber man wird noch ein bisschen darüber reden müssen, wie das genau ausgestaltet wird und wie auch die Zugangsbedingungen sind. Denn vermutlich wird auch eine Datentreuhandstelle Aufwand verursachen, und diesen Aufwand wird irgendjemand zahlen müssen, um das leidige Thema der Kosten hier nochmal anzusprechen.
[01:00:05] Doreen Siegfried:
Ja, okay, ja. Vielleicht noch eine letzte Frage zum Thema Wissenschaftspolitik. Was sind denn aus Deiner Sicht so die dringendsten Schritte, die von der Wissenschaftspolitik, egal unter welcher Farbe, unternommen werden müssten, um den Datenzugang langfristig zu verbessern? Also, es gibt ja zahlreiche Positionspapiere aus der Fachcommunity. Also, was ist auf Platz eins? Was ist das aller, allerwichtigste? Sind das diese Datentreuhandgeschichten, oder was, würdest Du sagen, muss als erstes angepackt werden?
[01:00:37] Bernhard Miller:
Also ich würde sagen, und das richtet sich nicht nur an die Wissenschaftspolitik, sondern dass es, um die Verknüpfbarkeit von Daten aus unterschiedlichen Quellen für wissenschaftliche Zwecke zu ermöglichen, klare Identifier geben muss. Also, dass von mir aus, meine Steuer-ID auch irgendwie an meinen Daten zum Studiumsverlauf, zum Promotionsverlauf mit dranhängt, dass sie an meinen Daten zur Sozialversicherung mit dranhängt und so weiter und so fort. Dass man wirklich sinnvoll Informationen zusammenspielen kann. Dass… Also, aber das ist tatsächlich komplementär zu den Dingen, über die wir bereits gesprochen haben. Aber man reduziert den Aufwand bei der Datenverknüpfung schon um ein N-faches, wenn man irgendwie eine eindeutige ID hat und nicht irgendwie zig Zwischenschritte nehmen muss, um Daten aus verschiedenen Quellen zusammenzulegen.
[01:01:32] Doreen Siegfried:
Sowas wie die schwedische Personennummer, ne?
[01:01:36] Bernhard Miller:
Ja, ja, genau. Also andere Länder, die … Also alle Länder, die immer als Vorbilder hochgehalten werden, haben so was. Und das ist durchaus logisch, dass das eine mit dem anderen zusammenhängt.
[01:01:47] Doreen Siegfried:
Ja, okay. Letzte Frage Bernhard. Welche drei Tipps hast Du für Forschende, also vielleicht sogar für Wirtschaftsforschende, die den Zugang zu Daten, Skripten, Codes, Forschungssoftware und so weiter in ihren Projekten verbessern und effektiver gestalten wollen?
[01:02:03] Bernhard Miller:
Ja, cool. Das ist so eine Hands-on-Frage. Also, erstens, beschreibt Eure Daten, wenn Ihr wollt, dass sie irgendjemand nachnutzen will. Beschreibt Euren Code und Eure Skripte einmal in allgemein verständlicher Sprache im Sinne von einem Abstract, das finden Suchmaschinen und dann eben auch mit den gängigen Metadaten-Schemata. Zweitens bringt das Ganze in reputierten, reputablen Repositorien unter, die eben dann zum Beispiel auch, wir waren da schon, von Google durchsucht werden, damit das findbar ist und verseht das Ganze mit einer Persistent Identifier, also einer DOI, damit sozusagen auch die Zitierbarkeit gewährleistet ist. Und damit kommen wir zu Drittens, und das ist der wichtigste Schritt, auch darüber haben wir schon gesprochen. Die meisten Forschenden finden Daten, aber auch Forschungssoftware über Literatur. Das heißt, all das muss in Literatur zitierbar sein. Das ist ein Aspekt. Und der andere Aspekt ist halt, zitiert es selber oder sorgt dafür, dass in Euren Gruppen, in euren Peer Groups das Bewusstsein dafür da ist, dass sowas zitiert werden muss. Weil nur dann wird sozusagen ein Bekanntheitsgrad erreicht, der tatsächlich eine Nachnutzung und aber auch eine Würdigung der Leistung, die ja sowohl in Skripten, als auch in Software, als auch in Daten steckt. Nur dann ist sozusagen das gewährleistet.
[01:03:32] Doreen Siegfried:
Ja, super, okay. Ich danke Dir ganz herzlich. Vielen Dank auch an Sie an den Kopfhörern! Ich hoffe, es hat Ihnen gefallen. Lassen Sie uns Lob und Kritik da. Gern via E-Mail, Mastodon, YouTube oder LinkedIn. Sie finden in den Shownotes alle wichtigen Hands-on-Tipps zum Thema Forschungsdatenmanagement. Und wir freuen uns natürlich auch, wenn Sie uns abonnieren. Und ich bin gespannt aufs nächste Mal.
[01:03:58] Outro