Folge 46: EOSC EU Node
The Future is Open Science – Folge 46: EOSC EU Node
Dr. Doreen Siegfried
Leitung Marketing und Public Relations, ZBW – Leibniz-Informationszentrum Wirtschaft
Professor Dr. Klaus Tochtermann
Direktor der ZBW – Leibniz-Informationszentrum Wirtschaft, Vorstandsmitglied der EOSC Association, Mitglied des wissenschaftlichen Senats der Nationalen Forschungsdateninfrastruktur
[00:00:00] Intro
[00:00:03] Klaus Tochtermann:
Das ist, aus meiner Sicht, die größte Infrastruktur in Europa, die die Open-Science-Bewegung unterstützt und für die Open-Science-Bewegung konstruiert wurde.
[00:00:19] Klaus Tochtermann:
Aber jetzt ist es wichtig, dass aus der Wissenschaftscommunity die Daten zugänglich gemacht werden, von denen man möchte, dass andere sie auch nutzen, weil man sie eben selbst genutzt hat. Also, jetzt muss Content, Content, Content rein.
[00:00:36] Klaus Tochtermann:
Dann gibt es noch unterschiedliche Suchlogiken, unterschiedliche Metadaten, Schemata. Das ist halt im EOSC, in der EOSC Federation vereinheitlicht. Und dadurch erwarte ich mir wirklich eine Öffnung auch der disziplinären Forschung hin zu interdisziplinärer oder disziplinübergreifender Forschung.
[00:01:05] Doreen Siegfried:
Hallo und herzlich willkommen zu einer neuen Folge von „The Future is Open Science“, dem Podcast der ZBW. Mein Name ist Doreen Siegfried und ich treffe mich hier mit ganz unterschiedlichen Leuten aus dem Wissenschaftsbetrieb, die Ihnen verraten, wie sie in ihrer täglichen Arbeit Open Science voranbringen. Heute wollen wir über den EOSC EU Knoten sprechen, den ersten Zugang zur European Open Science Cloud, der Ende Oktober auf dem EOSC Symposium in Berlin offiziell für alle Forschenden in Europa freigeschaltet wurde. Was ist das jetzt für ein Knoten? Ein Knoten in welchem Netz? Und was verbindet dieser Knoten? Um diese Fragen zu besprechen, habe ich mir eingeladen, ein Vorstandsmitglied der EOSC Association, der zugleich auch Mitglied des wissenschaftlichen Senats der Nationalen Forschungsdateninfrastruktur ist ─ kurz NFDI. Er ist Universitätsprofessor für digitale Informationsinfrastrukturen an der Christian-Albrechts-Universität zu Kiel und seit über zehn Jahren Chair der internationalen Open Science Conference. Außerdem ist er Direktor der ZBW. Herzlich willkommen, Professor Dr. Klaus Tochtermann.
[00:02:17] Klaus Tochtermann:
Hallo Doreen. Vielen Dank für die Einladung.
[00:02:20] Doreen Siegfried:
Klaus, was sind aus Deiner Sicht die zentralen Ziele und Visionen der European Open Science Cloud?
[00:02:28] Klaus Tochtermann:
Die Idee der European Open Science Cloud oder kurz EOSC ist es, die vielen Datensilos, die wir in Europa haben, also Repositorien, in denen Forschungsdaten der unterschiedlichen Disziplinen liegen, miteinander zu verknüpfen. So zu verknüpfen, dass wir vor allen Dingen Forschungsfragen, die in zunehmendem Maße Disziplinen übergreifend sind, unterstützen können bei der Beantwortung. Das heißt, in vielen Disziplinen braucht man Daten nicht mehr nur aus der jeweiligen Disziplin, sondern aus Nachbardisziplinen, um Fragen, Forschungsfragen beantworten zu können. Insgesamt möchte man einen Beitrag dazu leisten, dass wir ein europäisches Web of Fair Data and Services entwickeln, also faire Daten und faire Dienste in Europa für Europa.
[00:03:18] Doreen Siegfried:
Aha, okay. Wie hat sich denn die EOSC seit ihrer Entstehung entwickelt und warum ist jetzt dieser Knoten, also diese aktuelle Freischaltung des EOSC EU Node, so bedeutsam für Forschende in Europa?
[00:03:31] Klaus Tochtermann:
Also, wie hat sie sich entwickelt? Ehrlich gesagt langsam.
[00:03:33]
[beide lachen]
[00:03:35] Klaus Tochtermann:
Langsam. Wir sind ja tatsächlich seit 2015 an der Gestaltung der EOSC dran. Also seit nunmehr zehn Jahren. Und jetzt nach zehn Jahren gibt es endlich mal eine anfassbare, nutzbare Infrastruktur. Und diese Infrastruktur materialisiert sich eben in dem sogenannten EOSC EU Node. Das ist also der Kern der EOSC, finanziert und bereitgestellt von der Europäischen Kommission.
[00:04:03] Doreen Siegfried:
Ja, okay. Dieser Knoten wurde ja, wie Du schon sagtest, als Referenzimplementierung freigeschaltet. Was bedeutet das jetzt konkret für die Forschungs- und Wissenschaftslandschaft in Europa?
[00:04:16] Klaus Tochtermann:
Wir haben jetzt mit dem EOSC EU Node erstmalig einen zentralen Ausgangspunkt in die Forschungsdatenwelt Europas. Und dieser Ausgangspunkt bietet aktuell verschiedene Services, vor allen Dingen Infrastrukturservices. Das heißt, beispielsweise können Forschende dort Kapazitäten für Speicherbedarf nutzen. Sie können Rechenkapazitäten nutzen, es gibt Unterstützung, um große Datenmengen hochzuladen. Und in weiterer Folge soll ein Ökosystem aus Datenzentren drum herum entstehen.
[00:04:53] Doreen Siegfried:
Und wie viele Ressourcen finden sich schon in dieser Plattform?
[00:04:57] Klaus Tochtermann:
Es hängt von der Perspektive tatsächlich ab. Also, ich selbst habe in einem Vortrag gesagt, da sind schon 120 Millionen Ressourcen drin. Da wurde ich von der Kommission korrigiert: „Nein, es sind null Ressourcen drin.“
[00:05:12] Doreen Siegfried:
Oh, okay.
[00:05:13] Klaus Tochtermann:
Also, es ist schon eine große Differenzierung. Also, tatsächlich ist es so, wenn man auf den EOSC EU Knoten geht, kann man eine Suche starten und der Suchraum referenziert 120 Millionen Ressourcen, die vor allen Dingen aus einem anderen Angebot ─ OpenAIRE ─ kommen, aber auch aus Kommissionsangeboten. Das sind aber nur die Metadaten. Die eigentlichen Ressourcen liegen dann in den jeweiligen Repositorien. Deswegen ist die Aussage der Europäischen Kommission, da sind noch gar keine Ressourcen drin, in gewisser Hinsicht richtig, weil die eigentliche, der eigentliche Datensatz liegt halt woanders…
[00:05:49] Doreen Siegfried:
Ja, okay.
[00:05:49] Klaus Tochtermann:
…und nicht im EOSC EU Node. Und bislang, er ist ja erst vor vier Wochen offiziell zugänglich geworden, bislang sind tatsächlich noch keine Forschungsdaten hochgeladen worden, was auch ein bisschen an der Logik liegt, wie dieser EOSC EU Node genutzt werden kann. Da kommen wir vielleicht später noch mal drauf.
[00:06:11] Doreen Siegfried:
Okay, aber ich kann mich ja sozusagen als Nutzer dafür registrieren?
[00:06:16] Klaus Tochtermann:
Man kann sich als ja Forschender, als Mitglied einer Infrastruktur registrieren. Also es geht. Das geht über ein einheitliches Login-Schema, das alle Einrichtungen in Europa bedienen können. EduGAIN heißt das. Da ist schon eine Grenze gesetzt. Also es können nur Forschende aus Europa im Moment einen Login bekommen. Und jetzt gibt es so eine Spezialität, von der ich selbst noch nicht weiß, ob die sich dauerhaft tatsächlich bewähren wird. Also, die Idee ist, dass Nutzende bis zu 500 Credits bekommen, wenn sie sich einloggen. Also 500, ich nenne es mal Bonuspunkte, eine virtuelle Währung. Und für jeden Dienst, den man nutzt, muss man auf Basis dieser Währung bezahlen. Und dann geht das eben irgendwann runter auf null. Und nach 90 Tagen wird die Währung, wird das Wallet, wieder aufgefrischt und weitere 500 Creditpoints sind da drin. Allerdings bekommen nur Mitglieder einer Forschungseinrichtung diese Credits. Das heißt wenn wir uns als ZBW…
[00:07:21] Doreen Siegfried:
Ah.
[00:07:22] Klaus Tochtermann:
Ich kann mich zwar einloggen, aber da die ZBW als Infrastruktureinrichtung, als Serviceprovider und nicht als Research Performing Organization, registriert ist, bekommen wir in der ZBW ─ und das gilt für alle Bibliotheken in Deutschland beispielsweise ─ keinen Credit. Also haben null Credits und können gar nichts machen.
[00:07:43] Doreen Siegfried:
Okay.
[00:07:44] Klaus Tochtermann:
Ob das so ein kluges Konzept ist, weiß ich nicht. Die Logik dahinter war, sie wollten zu Beginn eben den Fair Use vom EOSC EU Node sicherstellen, also wollten vermeiden, dass Einzelpersonen, einzelne Forschungsteams alle möglichen Ressourcen in erheblichem Ausmaß nutzen auf Kosten anderer, die sie eben nicht nutzen können.
[00:08:02] Doreen Siegfried:
Okay, das heißt, Du könntest Dich aber trotzdem als Professor der Universität Kiel da einloggen. Mal angenommen, Du würdest jetzt sozusagen, Du oder jemand anderes aus der Forschung, begeistert sein davon, von dieser Plattform. Und das Wallet wäre vor diesen 90 Tagen schon leer. Kann man irgendwas machen, um das wieder aufzuladen?
[00:08:23] Klaus Tochtermann:
Ja. Ich kenne es nur aus Erzählungen. Es gibt eben auch so ein Anreizsystem. Wenn man zum Beispiel andere motiviert, auf die Plattform zu gehen, Teams gründet, dann kann man tatsächlich bis zu 1.000 Credits bekommen…
[00:08:37] Doreen Siegfried:
Ah.
[00:08:38] Klaus Tochtermann:
…für so eine Initiative. Also, da ist durchaus ein Anreizsystem, ähnlich, wie man es aus anderen ähnlichen Plattformen kennt. Wenn ich andere auf die Plattform hole, wird das belohnt.
[00:08:48] Doreen Siegfried:
Okay, dann kann ich Bonuspunkte mir sozusagen erarbeiten. Alles klar. Du hast jetzt schon das Thema FAIR Data erwähnt. Inwieweit trägt dann tatsächlich dieser EOSC EU Node zur Förderung von FAIR Data bei? Und warum ist das für die Europäische Forschungsgemeinschaft so wichtig?
[00:09:08] Klaus Tochtermann:
Vielleicht zunächst kurz noch mal FAIR erklären, also findable, accesssable, interoperable, reusable. Es trägt vor allen Dingen dazu bei, dass die Daten auffindbar sind und dass sie zugänglich sind. Das sind sicherlich ganz, ganz wichtige Größen. Wir haben viele Forschungsdaten in Repositorien, die abgelegt sind, aber von außen einfach nicht auffindbar sind, weil sie nicht findable sind, weil sie beispielsweise…
[00:09:35] Doreen Siegfried:
…nicht suchmaschinenoptimiert sind.
[00:09:35] Klaus Tochtermann:
…nicht gut beschrieben sind, keine Metadaten haben. Sie sind nicht zugreifbar, weil sie keinen eindeutigen Identifier haben, über den man die erreichen kann. Und mit dem EOSC EU Node, oder der ganzen EOSC letztendlich, soll da halt Abhilfe geschafft werden und die Kriterien für quasi Repositorien, die sich andocken wollen, implizieren eben, dass man auch seine Daten FAIR bereitstellen muss, zumindest bis zu einem gewissen Grade. Also FAIR ist ja keine binäre Relation. Es ist wahr oder es ist falsch. Sondern da gibt es ja durchaus Abstufungen. Aber das F und das A, auffindbar und zugänglich sollten die Daten jedenfalls sein. Zugänglichkeit vielleicht nur mit ein paar Einschränkungen. Wenn es sensitive Daten sind, aus Panelstudien beispielsweise, oder wenn Haushalte befragt werden, dann kann man natürlich die Daten nicht offen zugänglich machen.
[00:10:22] Doreen Siegfried:
Okay. Aber das kennen Forschende ja sozusagen aus anderen Repositories. Jetzt gibt es diesen Knoten Nummer eins. Also wie kommen denn jetzt weitere Knoten dazu? Wie läuft genau diese Aufbauphase?
[00:10:36] Klaus Tochtermann:
Wir, und das ist jetzt die EOSC Association, haben zusammen mit der Kommission und den Mitgliedsstaaten einen Aufruf gestartet, in dessen Zuge sich interessierte Einrichtungen bewerben konnten. Bewerben konnten ihr Datenangebot oder ihre Services an den EOSC EU Node anzudocken. Wir hatten insgesamt 121 Bewerbungen. Aus diesen 121 Bewerbungen hat man entlang eines Kriterienkatalogs 22 identifiziert, die jetzt zur Wahl stehen, ob sie in den EOSC EU Knoten kommen oder nicht. Man kann zum jetzigen Zeitpunkt 7 bis 10 aufnehmen. Das liegt einfach daran, dass die Kapazitäten der Betreiber vom EOSC EU Node nicht mehr als 7 bis 10 potenzielle Kandidaten betreuen können. Das ist ja auch ein erheblicher Betreuungsaufwand auf deren Seite. Da beginnen morgen, also am 5. Dezember 2024, die ersten Auswahlgespräche. Die Auswahlgespräche sind organisiert entlang von vier thematischen Töpfen. Man hat also Bewerbungen einer gleichen Art in einen Topf geworfen. Zum Beispiel haben wir relativ viele Bewerbungen bekommen aus den Lebenswissenschaften Gesundheit. Sie sind alle in einem Topf. Oder wir haben relativ viel ─ ich glaube acht ─ Bewerbungen, wo ein Mitgliedsstaat gesagt hat, wir wollen unsere Nationale Infrastrukturanstrengung an den EOSC EU Node andocken. In Deutschland ist das die Nationale Forschungsdateninfrastruktur, die sich beworben hat. Und für jeden Topf hat man festgelegt, eine maximale Anzahl, wie viel aus jedem Topf genommen werden können. Es muss aus jedem Topf einer genommen werden, aber die Anzahl ist gedeckelt und wir haben, wie gesagt, vier Töpfe. Sagen wir pro Topf zwei. Dann endet man bei diesen acht. Die stehen also in gewisser Hinsicht in einem Wettbewerb. Wenn man jetzt in dem ersten, in der ersten Welle den Zuschlag nicht bekommt, ist das nicht schlimm, weil es wird eine zweite Welle geben, eine dritte Welle geben. Und ehrlich gesagt, je später man mitmacht, desto klarer ist auch der Prozess, desto klarer sind die Schnittstellen, desto klarer sind die ganzen Rahmenbedingungen, deren Kenntnis erforderlich ist, um sich mit seiner eigenen Infrastruktur anzudocken. Die Einrichtungen der ersten Welle werden sehr viel auch Aufbauarbeit leisten müssen, um Prozesse festzulegen, um Governance-Strukturen festzulegen, von denen dann die zukünftigen Knoten, die sich andocken werden, profitieren können.
[00:13:16] Doreen Siegfried:
Okay, also die ersten sind jetzt quasi die Versuchskaninchen für diese ganzen Strukturen?
[00:13:21] Klaus Tochtermann:
So haben wir es nicht formuliert.
[00:13:22]
[beide lachen]
[00:12:22] Klaus Tochtermann:
Aber es sind natürlich diejenigen, die gestaltend bei der Weiterentwicklung relevanter Dokumente und Schnittstellen mitwirken.
[00:13:32] Doreen Siegfried:
Okay. Noch mal eine Frage zum Verständnis. Also es haben sich jetzt 121 beworben. Daraus wurden 22 ausgesucht. Das ist sozusagen die Shortlist. Und dann gab es aber noch keine fertigen Schubladen nach dem Motto „Wir sortieren nach Fachdisziplinen“, „wir sortieren nach Nationalität“. Sondern es wurde geguckt, wo gibt es so, ich sag mal, Haufen,…
[00:13:56] Klaus Tochtermann:
Genau.
[00:13:56] Doreen Siegfried:
…die besonders groß sind und von denen wir jetzt nicht so ein Übergewicht haben wollen.
[00:14:01] Klaus Tochtermann:
Genau. Also, so war das. Und der Auswahlprozess sieht dann vor, dass man im ersten Gespräch mit allen Einrichtungen eines Topfes spricht. Also, in dem Gespräch, an dem die NFDI in Deutschland beteiligt sein wird ─ das findet am 9. Dezember statt ─ werden auch die anderen nationalen Angebote drin sein und man spricht mit denen. Im Januar wird es dann Einzelgespräche geben mit den bewerbenden Einrichtungen und im Februar wird dann eine Auswahl getroffen, mit wem man starten möchte.
[00:14:34] Doreen Siegfried:
Ah ja, okay. Und wie sind die technischen Anforderungen an diese weiteren Knoten? Gibt es da irgendwie so einen Leistungskatalog?
[00:14:41] Klaus Tochtermann:
Das ist das sogenannte EOSC Federation Handbook, weil insgesamt wird ja eine Föderation entwickelt. Eine Föderation heißt, wir haben sozusagen den Kernknoten, den EOSC EU Node und drum herum werden andere Infrastrukturen föderiert, angedockt. Und das Federation Handbook beschreibt genau solche Anforderungen. Es sind, und das ist ganz wichtig, nicht nur technische Anforderungen. Es geht auch um die Governance. Beispielsweise ist es verpflichtend, dass jeder Knoten eine juristische Person ist. Also wir können ─ und das wurde auch heftig diskutiert ─ im Moment kein Projekt annehmen, dass sich an ein Projekt andockt. Es muss eine juristische Person sein. Es geht darum, dass die Policies haben, die müssen aufeinander abgestimmt sein. Wie man das machen kann, wird auch entwickelt in der Zukunft also. Und dann natürlich die technischen Rahmenbedingungen. Wobei, da wird natürlich auch viel von dem EOSC EU Node schon vorgegeben. Beispielsweise das Login wird halt auf eduGAIN basieren, was aber ein bekannter Standard ist. Das ist jetzt nicht schlimm. Aber auf welcher Basis deren Metadatenschema basiert, ob das DataCite ist oder Dublin Core, das weiß ich im Moment gar nicht. Und das wird aber gesetzt sein. Das wird man nicht ändern können. Und dann müssen wir halt unsere Schemata auf diese entsprechenden Schemata des EOSC EU Node mappen.
[00:16:09] Doreen Siegfried:
Ja, okay. Du hast jetzt gesagt, in der ersten Welle werden erstmal so 7 bis 10 neue Knoten an Bord geholt, nenne ich es mal. Und dann gibt es weitere Wellen. Wie viele Wellen sind denn da eigentlich angedacht? Also wenn ich mir vorstelle, bei der ersten Bewerbung haben sich schon über 120 Leute gemeldet, das würde ich… Das würde dann ja heißen, mal angenommen, die wären jetzt alle entsprechend des Leistungskataloges geeignet, dann sind wir ja schon bei zwölf Jahren, bei zwölf Wellen, bis alle mal dabei sind. Oder wie, wann macht man da mal einen Deckel drauf und sagt „so, jetzt reicht’s auch“?
[00:16:46] Klaus Tochtermann:
Wir denken im Moment zunächst an drei Wellen, die wir auch von Seiten der EOSC Association begleiten werden. Und die Idee ist ja, mit jeder Welle wird quasi der Onboarding-Prozess weiter standardisiert, automatisiert. Und irgendwann, das ist die Zielvorstellung, braucht man diese Bewerbungswellen nicht mehr.
[00:17:08] Doreen Siegfried:
Okay. Und dann kann man mehr mitnehmen.
[00:17:10] Klaus Tochtermann:
Dann kann man mehr mitnehmen. Dann können die einfach sagen, ich will Mitglied werden. Dann gibt es vielleicht noch eine Formalprüfung. Aber wie sie dann Mitglied werden, wie sie sich andocken, ist dann so hochgradig standardisiert, dass man diese ganze Einzelbetreuung, die wir jetzt am Anfang leisten müssen, nicht mehr benötigt. Und sie können sich einfach technisch andocken.
[00:17:30] Doreen Siegfried:
Okay. Wenn wir jetzt mal auf diesen EU-Knoten gucken. Man sagt, okay, jetzt sind die ersten dabei und irgendwann haben wir tatsächlich ein riesen Netzwerk mit ganz vielen Knoten. Was sind dann in Deinen Augen so die Erfolgskriterien? Also, was muss passiert sein, ich sag mal, damit Du als Experte für digitale Informationsinfrastrukturen sagen kannst, jetzt ist tatsächlich was Großes geschaffen?
[00:17:58] Klaus Tochtermann:
Also der EOSC EU Node oder die EOSC insgesamt sollte bekannt sein. Also die Leute, die Forschenden in Europa, sollten wissen, dass es dieses Angebot gibt, und sie sollten es in ihrer täglichen Arbeit nutzen, selbst wenn sie nicht merken, dass sie es nutzen. Bei guten Infrastrukturen ist es ja häufig so, dass sie unsichtbar sind für die Nutzenden. Es wird halt irgendein Dienst geliefert, werden Forschungsdaten geliefert. Aber woher die kommen, wissen die Forschenden mitunter nicht. Müssen sie ja auch nicht. Also die Idee, wenn Forschende über ihr Repository ihres Vertrauens Forschungsdaten suchen und dann welche aus der EOSC geliefert bekommen und sich das in der Breite durchgesetzt hat, dann ist das ein Erfolg. Wir werden sicherlich den Erfolg auch messen an den Nutzenden auf dem Portal.
[00:18:51] Doreen Siegfried:
Ja.
[00:18:51] Klaus Tochtermann:
Also die klassische Indikatorik. Und dann, sofern wir es messen können, auch Downloads von Forschungsdaten. Das ist die Perspektive aus der Wissenschaft. Wenn man die Kommission fragen würde, käme noch ein weiteres Erfolgskriterium dazu. Das ist nämlich der Single Digital Market in Europa. Also, wie viele Innovationen sind denn in Europa, also für den europäischen Markt, entstanden, aufgrund der Tatsache, dass wir diesen zentralen quasi EOSC EU Node oder die Federation, diesen zentralen Einstiegspunkt zur Forschungsdatenwelt in Europa, haben?
[00:19:30] Doreen Siegfried:
Okay, das heißt die Bekanntheit müsste dann bei den Repositorybetreibern sein? Dass die das sozusagen connecten…
[00:19:37] Klaus Tochtermann:
Genau.
[00:19:38] Doreen Siegfried:
…und sich selbst als Knoten sozusagen andocken.
[00:19:42] Klaus Tochtermann:
Genau.
[00:19:43] Doreen Siegfried:
Okay. Und für die Forschenden selbst ist es einfach sozusagen ein Hintergrunddienst, der ihnen aber ermöglicht, tatsächlich auf eine Vielzahl von Forschungsdaten zuzugreifen?
[00:19:53] Klaus Tochtermann:
Genau.
[00:19:53] Doreen Siegfried:
Ist es denn technisch möglich ─ weil Du sagtest, okay, die einzelnen Repositories, die speichern ja die Daten ─ diese Downloads zu zählen über die EOSC?
[00:20:08] Klaus Tochtermann:
Das wird ein Teil der Verhandlungen sein zwischen EOSC EU Node und den angedockten Repositorien, ob die Repositorien die Downloadzahlen an die EOSC-EU-Node-Betreiber berichten. Das kennen wir aus dem Verlagswesen ja auch. Wir haben ja viele in der ZBW Publikation, die wir nicht hosten. Also digitale Publikationen. Die liegen beim Verlag. Wir bekommen also unmittelbar die Downloadzahlen nicht mit, aber lassen uns die von den Verlagen berichten.
[00:20:32] Doreen Siegfried:
Ja, okay.
[00:20:33] Klaus Tochtermann:
Und ein ähnliches Modell müsste man hier fahren.
[00:20:35] Doreen Siegfried:
Ja, ja, spannend. Welche Herausforderungen siehst Du denn aktuell in der Implementierung und Nutzung des EOSC EU Node und wie können die aktuell überwunden werden?
[00:20:47] Klaus Tochtermann:
Also, ich glaube wir sind jetzt einfach in der Phase, wo man das aktuelle Angebot aus meiner Sicht nicht überbewerten sollte. Ich selbst bin, wie gesagt, relativ kritisch diesen Credits gegenüber. Ich fühle mich ja selbst ausgeschlossen, weil ich mit unserer Einrichtung das gar nicht nutzen kann, obwohl wir Forschung in der ZBW haben. Und das gilt ja in vielen Infrastruktureinrichtungen. Und daraus kann halt auch resultieren, dass der erste Eindruck nicht positiv ist, was zu Ablehnungen führt. Und selbst wenn dann das Angebot in einem Jahr oder in zwei Jahren super ist, ist das Image vielleicht nicht mehr zu reparieren. Das kann also wirklich ein Punkt sein. Ein weiteres Risiko kann tatsächlich sein, dass das Ganze mit dem Onboarding nicht funktioniert. Oder nach dem ersten, nach der ersten Welle sich herumspricht, es macht keinen Sinn, ist viel zu kompliziert, was sie da alle von uns wollen. Wir haben ja…
[00:21:45] Doreen Siegfried:
Dass es zu bürokratisch wird, meinst Du?
[00:21:47] Klaus Tochtermann:
Ja. Vor allen Dingen auch deshalb, weil dieser EOSC EU Node der gehört der Europäischen Kommission und er wird im Moment von der Europäischen Kommission betrieben. Das halte ich für eine unglückliche Situation. Das wäre, als würde die DFG hier in Deutschland eine große Publikationsinfrastruktur betreiben. Das soll doch bitte die Wissenschaft für die Wissenschaft machen und nicht eine Kommission. Und die Kommission ist ja nun auch dafür bekannt, dass sie gerne Top-down-Prozesse vorantreibt. Also da halte ich es für extrem wichtig, dass wir es schaffen, die Forschungsgemeinschaft nicht zu verlieren. Und dafür wird man was tun müssen. Dass nur, weil es die Kommission ist, ist das hier nicht unbedingt ein good selling point. Also ich sehe eher die Schwierigkeiten gar nicht so sehr auf der technischen Seite, als auf dieser ganzen Ebene der „Wie kommuniziert man es?“, „Wie ist die Governance-Struktur?“. Welche Policies entwickelt man, sodass es für die Betreibenden von Forschungsdaten-Repositorien auch attraktiv ist, sich anzudocken und für die Forschenden attraktiv ist, es dann auch zu nutzen? Da haben wir eben drüber gesprochen.
[00:23:04] Doreen Siegfried:
Okay. Andererseits denke ich natürlich, wenn jetzt gleich in der ersten Welle sich 121 Bewerber gefunden haben, scheint da ja auf jeden Fall eine große Vorfreude zu herrschen, was diese Andockeffekte für Repositorien heißt, oder?
[00:23:20] Klaus Tochtermann:
Ja. Wobei wir nicht ─ oder ich zumindest nicht ─ genau die Analyse der Motivationsgründe für die Bewerbung kenne. Es kann ja durchaus auch sein, dass ein Motivationsgrund die Hoffnung ist, wenn ich mich andocke an den EOSC EU Node, dann ist die Nachhaltigkeit meiner Infrastruktur über die Kommission gewährleistet.
[00:23:45] Doreen Siegfried:
Ja, okay.
[00:23:46]
[beide lachen]
[00:23:46] Klaus Tochtermann:
Das ist durchaus auch eine Logik. Und wir beobachten das Phänomen an einer anderen Stelle, dass eine gewisse Erwartungshaltung entsteht, dass irgendjemand aus dem EOSC-Umfeld, sei es die EOSC Association, sei es die EOSC-EU-Node-Betreiber, sei es die Kommission, eine Infrastruktur dauerhaft betreibt, nur, weil sie an den EOSC EU Node angedockt ist. Aber diese Logik trifft überhaupt nicht zu. Also das ist ein komplettes Missverständnis. Und in der Tat müsste man mal schauen, ob unter den 121 Bewerbungen viele sind, die das als Motivation hatten. Und sie müssen es natürlich ausgedrückt haben. Vielleicht haben sie die im Hintergrund und es ist nicht in der Bewerbung direkt ausgedrückt worden. Aber das wäre natürlich die schlechteste aller Motivationen.
[00:24:34] Doreen Siegfried:
Ja, okay. Dass das so ein Rettungsring ist, okay. Inwieweit unterstreicht dann die Einführung dieses Knotens, also des EOSC EU Node, die Bedeutung der europäischen Forschungsdateninfrastruktur auch für Open Science und darüber hinaus?
[00:24:48] Klaus Tochtermann:
Das ist, aus meiner Sicht, die größte Infrastruktur in Europa, die die Open Science Bewegung unterstützt und für die Open Science Bewegung konstruiert wurde. Also es ist halt, wir haben jetzt nach neun, nee nach acht Wochen Größenordnung haben wir 900 Registrierende, Nutzende auf der Plattform, ohne das jetzt groß eine Outreach-Kampagne gestartet wurde. Von der Infrastruktur her sind aufgrund der Kompetenzen der Partner wirklich gute Services da, die auch sicherlich funktionieren werden. Und wenn es die Community annimmt, haben wir da, was Forschungsdaten angeht, wirklich die größte, die für Offenheit in der Wissenschaft ist. Und Forschungsdaten, das möchte ich hier noch mal erwähnen, sind ja nicht nur die numerischen Daten. Forschungsdaten, das hat ja der RfII sehr breit definiert, können ja auch beispielsweise Digitalisate sein. Es können qualitative Daten sein, also Videoaufnahmen aus bestimmten Settings, die dann analysiert werden. Es können Karten sein. Also es ist die ganze Bandbreite an digitalen Objekten. Und das ist dann natürlich wirklich eine großartige Umgebung, die hier für Open Science gebaut und geschaffen und vor allen Dingen auch betrieben wird.
[00:26:16] Doreen Siegfried:
Okay. Welche Rolle spielen denn politische und institutionelle Partnerschaften für den Erfolg der EOSC?
[00:26:22] Klaus Tochtermann:
Die politischen Partnerschaften sind die wichtigsten, weil es ein europäisches Vorhaben ist, in dem die Europäische Kommission zusammen mit den Mitgliedsstaaten und sogar den assoziierten Ländern zusammenarbeitet. Und dort werden große politische Entscheidungen getroffen, was die Zukunftsfähigkeit, die zukünftige Governance-Struktur, die zukünftige Finanzierungsstruktur der EOSC Federation betrifft, getroffen hat. Das findet dort statt. Das ist also die… das ist die politische Dimension. Ein weiterer Player sind natürlich die Forschungseinrichtungen, repräsentiert über die EOS Association und ihre Mitgliedschaften. Wir treffen uns sehr regelmäßig in einem sogenannten Tripartite-Meeting, wo alle drei Anspruchsgruppen zusammenkommen und sich über die Weiterentwicklung der EOSC austauschen. Durchaus natürlich mit unterschiedlichen Zugängen und Vorstellungen.
[00:27:25] Doreen Siegfried:
Ja, okay. Wie können Forschungseinrichtungen, Informations- und Infrastruktureinrichtungen, Wissenschaftler:innen Europas aktiv zur Weiterentwicklung dieses EOSC EU Knoten beitragen?
[00:27:40] Klaus Tochtermann:
Also, das erste ist mal, sich einloggen.
[00:27:42] Doreen Siegfried:
Ja.
[00:27:43] Klaus Tochtermann:
Ausprobieren, mitmachen.
[00:27:44] Doreen Siegfried:
Ja. Das Wallet verbraten. [lacht]
[00:27:47] Klaus Tochtermann:
Genau. Diese Credit Points nutzen und dann auch Referenzen auf die eigenen Daten oder die eigenen Daten hochstellen, so dass dort Content reinkommt. Denn wir wissen, all diese Infrastrukturen leben in erheblichem Maße von dem Content, der drin ist. Diese 120 Millionen Daten-Objekte, die bislang referenziert sind, das sind welche, die findet man auch anderswo. Da bin ich auch nicht sicher, ob das jetzt die allerwichtigsten sind. Es ist halt mal ein Aufschlag, damit was da ist. Aber jetzt ist es wichtig, dass aus der Wissenschaftscommunity die Daten zugänglich gemacht werden, von denen man möchte, dass andere sie auch nutzen, weil man sie eben selbst genutzt hat. Also jetzt muss Content, Content, Content rein.
[00:28:32] Doreen Siegfried:
Ja, okay. Also liebe Zuhörerinnen und Zuhörer, Sie haben es gehört: Content. Welche Erwartungen hast Du denn an die zukünftige Entwicklung weiterer Knotenpunkte in Zusammenhang mit dem EOS-EU-Knoten?
[00:28:44] Klaus Tochtermann:
Also, ich erwarte, dass die zukünftigen Knoten vor allen Dingen rechtlich selbstständig bleiben, sich nicht von der Kommission aufsaugen lassen. Also wir haben auch im Federation Handbook deswegen sehr klar beschrieben, dass ihre Policies, ihre Governance-Strukturen so erhalten bleiben und voll unter der Autorität und der Souveränität der betreibenden Einrichtung ist. Da wird der EOSC EU Node nicht eingreifen. Ich erwarte, dass sich diese angedockten Repositorien, Forschungsdatenzentren, Servicebetreiber aktiv in die weitere Ausgestaltung einbringen und dort mitwirken. Weil bislang ist es ja… Also dieser Kern ist ja Top-Down entwickelt worden. Das ist einfach eine Anforderungsdefinition gewesen, die die Kommission gemacht hat. Ist auch okay, es entspricht im Wesentlichen dessen, was die entsprechenden High Level Expert Groups vorgeschlagen hatten. Für den ─ damals hieß es ─ EOSC Core, also für die Kernfunktionalität. Jetzt bei der Ausgestaltung ist es wichtig, dass dieser Top-Down-Ansatz ein bisschen auch ausbalanciert wird mit Bottom-up-Empfehlungen, die aus den Repositorien, Forschungsdatenzentren, Services kommen, die eben in der Community existieren. Und dass sie da eine starke Stimme haben, vertreten durch die EOSC Association, ist mir wichtig. Es geht dann in weiterer Folge auch darum, wer managt eigentlich diese EOSC Federation, also diese Föderation, wo der EOSC EU Node ein Kernzentrum ist, aber auch viele sich andocken. Und hier haben wir eine sehr klare Position, dass das eigentlich nur die EOSC Association sein kann, weil wir eben die Forschenden, die über unsere Mitgliedseinrichtungen vertreten und quasi the voice of the Community sind, die einen Resonanzraum braucht im Kontext der Weiterentwicklung der EOSC. Also hier die klare Erwartungshaltung, dass diese Organisation das Management der EOSC Federation in den Händen der Wissenschaft liegt und nicht in den Händen der Fördergeber.
[00:31:09] Doreen Siegfried:
Ja, okay. Vielleicht mal eine persönliche Frage. Wie siehst Du denn die zukünftige Rolle der ZBW im Rahmen der europäischen Infrastrukturlandschaft und der Weiterentwicklung von Open-Science-Initiativen wie jetzt der EOSC beispielsweise?
[00:31:23] Klaus Tochtermann:
Wir haben uns jetzt, ich sagte das ganz zu Beginn unseres Gesprächs, seit zehn Jahren engagiert in dem Bereich des Aufbaus der EOSC. Irgendwann ist die Zeit des wissenschaftspolitischen Engagements zu Ende und wir werden uns dann vor allen Dingen in entsprechende Projekte einbringen. Auch INFRAEOSC-Projekte, also EU finanzierte Projekte, in denen wir mit anderen Partnern in Europa Infrastrukturen, die wir haben, die wir bauen werden, entwickeln, um sie an den EOSC EU Node anzudocken. Also, ein bisschen die Rolle wechseln, von den wissenschaftspolitischen Beratungen hin zum Tun, um dann auch Content, den wir haben, bereitzustellen. Das ist meine Vorstellung der Rolle der ZBW in der Zukunft.
[00:32:11] Doreen Siegfried:
Ja, okay, vielen Dank. Letzte Frage: Welchen Mehrwert siehst Du für Forschende?
[00:32:18] Klaus Tochtermann:
Für Forschende ist der Mehrwert da zum einen, dass sie einmal einen Platz haben, wo sie ihre Forschungsdaten sicher ablegen können. Aber ich glaube, fast wichtiger für Forschende ist, dass sie einen Zugang haben zu dem, über den sie Forschungsdaten aus unterschiedlichen Disziplinen zu einer Fragestellung erhalten. Und dann können sie eben disziplinenübergreifende Fragestellungen einfacher behandeln, beantworten, als es bislang der Fall war. Weil heutzutage muss man an jedes einzelne Forschungsdatenzentrum, an jedes einzelne Repository gehen, die Forschungsdatensätze suchen. Dann gibt es noch unterschiedliche Suchlogiken, unterschiedliche Metadatenschemata. Das ist halt in der EOSC Federation vereinheitlicht und dadurch erwarte ich mir wirklich eine Öffnung auch der disziplinären Forschung hin zu interdisziplinärer oder disziplinübergreifender Forschung.
[00:33:16] Doreen Siegfried:
Ja, ja, das wird spannend. Okay, vielen Dank. Vielen Dank auch an Sie an den Kopfhörern. Ich hoffe, Sie haben jetzt richtig Lust, sich die Credits, also mit Ihren Credits diesen Knoten auszuprobieren. Ich hoffe, es hat Ihnen gefallen. Lassen Sie uns gerne Lob oder Kritik da via E-Mail, Mastodon, YouTube, LinkedIn. Wir freuen uns natürlich auch, wenn Sie uns abonnieren und ich freue mich aufs nächste Mal.