Folge 12: European Open Science Cloud

Audio

Dr. Doreen Siegfried
Leitung Marketing und Public Relations, ZBW – Leibniz-Informationszentrum Wirtschaft

Prof. Dr. Klaus Tochtermann
Direktor der ZBW – Leibniz-Informationszentrum Wirtschaft und Vorstandsmitglied der European Open Science Cloud Association

[00:00:03] Doreen Siegfried:
Willkommen bei „The Future is Open Science“, dem Podcast der ZBW. Hier verraten Ihnen interessante Menschen aus dem Wissenschaftsbetrieb, wie sie in ihrer täglichen Arbeit Open Science voranbringen. Wir tauchen ein in die Tiefen der Wissenschaftskommunikation im digitalen Zeitalter und verraten Ihnen handfeste Tipps und Tricks zu Open Science in der Praxis. Ich bin Doreen Siegfried und freue mich sehr, Host dieses Podcast zu sein.

[00:00:33] Doreen Siegfried:
Hallo und herzlich willkommen zu einer neuen Folge von „The Future ist Open Science“, dem Podcast der ZBW. Wir steigen heute einmal ganz tief ein in die europäische Wissenschaftspolitik und reden über die verschiedenen Facetten und die Ausprägungen und Entwicklung der European Open Science Cloud. Und zu Gast habe ich zu diesem Thema Professor Dr. Klaus Tochtermann.

Ich stelle einmal unseren Gast heute vor: Klaus Tochtermann, was hat er mit dem Thema Open Science zu tun? Er hat 2012, also vor doch etlichen Jahren, den Leibniz Forschungsverbund Open Science initiiert, mit dem flankierenden Open Science Barcamp. 2014 hat er die Internationale Open Science Conference ins Leben gerufen, die seitdem jährlich stattfindet. Er ist Mitglied im Rat für Informationsinfrastrukturen. Für alle, die nicht ganz wissen, was der Rat für Informationsinfrastrukturen mit Open Science zu tun hat: das ist also das Gremium, welches die nationale Forschungsdateninfrastruktur, die NFDI, initiiert hat, wo auch im Übrigen die ZBW mit drei Konsortien beteiligt ist. Klaus Tochtermann war viele Jahre Mitglied der High Level Expert Group der European Open Science Cloud und auch Mitglied der Arbeitsgruppe Nachhaltigkeit in der European Open Science Cloud, die sich unter anderem beschäftigt hat mit dem Weg zur Ausgestaltung sowie auch mit dem Thema Nachhaltigkeit der European Open Science Cloud für die kommenden Jahre. Und er ist jetzt seit, ja, seit gut einem Jahr Vorstandsmitglied der European Open Science Cloud Association. Und darüber hinaus, man mag es nicht glauben, dass da noch Zeit übrig ist, ist er auch noch Direktor der ZBW. Also, herzlich willkommen Klaus Tochtermann.

[00:02:33] Klaus Tochtermann:
Hallo Doreen, schön, dass wir jetzt die Zeit finden, über dieses komplexe Thema zu sprechen. Ich hoffe, uns beiden gelingt das, die Komplexität rauszunehmen und das ganze Thema European Open Science Cloud und Umfeld verständlich zu verpacken.

[00:02:49] Doreen Siegfried:
Ja, das ist ein großes Thema. Wenn man sich mal anguckt, wann kam das Thema European Open Science Cloud das erste Mal auf die Tagesordnung. Also das war, wenn ich mich recht erinnere, und auch nochmal in die Dokumente gucke, 2015. Die European Open Science Cloud ist angetreten mit dem großen Ziel, die Forschenden aus ganz Europa letztlich mit einer digitalen Umgebung zu versorgen, in der sie ihre Forschungsdaten im weitesten Sinne managen können. Also nicht nur ihre eigenen und nicht nur die von anderen finden, sondern eben auch damit arbeiten können. Seitdem ist viel passiert. Also auf der Webseite steht, dass ungefähr 50 Projekte finanziert wurden mit 320 Millionen Euro. Ja, wo stehen wir jetzt im Jahre 2021? Wo steht dieses riesengroße, ich sag mal dieser Flughafen, European Open Science Cloud?

[00:03:52] Klaus Tochtermann:
Ja, sechs Jahre sind wir jetzt unterwegs. Und man muss natürlich berücksichtigen, dass das alles stattfindet in einem sehr komplexen wissenschaftspolitischen Prozess. Also wenn du sagst, im Jahr 2015 hat das begonnen, ist das richtig. Im Jahr 2015 haben die ersten Überlegungen begonnen, was überhaupt Anforderungen an ein europäisches Forschungsdatenmanagement sind. Das war das wesentliche Ergebnis der ersten High Level Expert Group on the European Open Science Cloud. Es gab dann noch eine zweite Expertengruppe, die sich damit befasst hat, und in der Zwischenzeit mussten dann auch entsprechende wissenschaftspolitische Prozesse auf Ebene der Europäischen Kommission angestoßen werden, damit nämlich Fördermittel für solche Vorhaben überhaupt zur Verfügung gestellt werden.

Und begonnen hat es dann mit Einzelprojekten, die einzelne Aspekte der European Open Science Cloud beleuchtet haben. „EOSC Pilot“ beispielsweise war das allererste. Da wurden Science Demonstrators entwickelt, also exemplarisch Demonstratoren, anhand derer man ein Gefühl dafür bekommen konnte, was aus der European Open Science Cloud heraus entstehen kann, aber natürlich wurde nicht die EOSC entwickelt. Und so gab’s also eine Vielzahl von Einzelprojekten, die unterschiedliche Aspekte beleuchtet haben im Umfeld Forschungsdatenmanagement.

Und erst in jüngster Zeit gibt es zwei Großprojekte „EOSC Secretariat“, um das zu benennen, und „EOSC Future“, wo jetzt Konvergenz stattfindet und auch die einzelnen Bestandteile, die in einzelnen Projekten entwickelt wurden, zusammengeführt werden sollen.

Und nur damit man ein Gefühl dafür bekommt, „EOSC Future“ ist ein Projekt mit 30 Monaten Laufzeit und 41 Millionen Euro Budget. Und deren Hauptaufgabe ist vor allen Dingen, wie ich es eben sagte, das zusammenzubringen, was in der Vergangenheit entwickelt wurde. Also man ist tatsächlich noch ein Stück weit davon entfernt, eine EOSC operativ im Wissenschaftssystem anbieten zu können.

[00:05:58] Doreen Siegfried:
Also geht es letztlich darum, um mal in dieser Architekturmetapher zu bleiben, erstmal so einen Bauplan zu entwickeln.

[00:06:06] Klaus Tochtermann:
Ein Bauplan wurde entwickelt in den vergangenen Jahren und quasi Prototypen gebaut, um zu zeigen, funktioniert das eigentlich? Und jetzt ist man so reif und so weit, um auch quasi die verschiedenen Baupläne zu einem großen Gemeinsamen zu entwickeln und ein entsprechendes System wirklich aufzusetzen.

[00:06:23] Doreen Siegfried:
Okay. Auf der Webseite da gibt es ja auch eine Liste von ganz vielen Projekten, wenn ich mich nicht verzählt habe, sind das ungefähr um die 50 Projekte. Wie sind die denn miteinander verzahnt? Oder sind die überhaupt jetzt schon verzahnt oder werden die jetzt erst noch in „EOSC Future“ miteinander verzahnt?

[00:06:46] Klaus Tochtermann:
Also auch da der Hintergrund ist, dass die Europäische Kommission für die Entwicklung von so einer Infrastruktur im Grunde nur Forschungsförderung für Projekte hat. Sie hätte ja auch alternativ sagen können, wir machen eine große Ausschreibung an einen der großen IT-Dienstleister, die wir in Europa haben, und die bauen uns das. Das ging aber nicht, weil die Mittel eben in einem Forschungsrahmenprogramm gebunden sind. Und daher kommen diese 50 Einzelprojekte. Die wurden zum Zeitpunkt der Entstehung weniger koordiniert. Das war noch nicht soweit, wie ich es eben sagte. Da hat man auf Einzelaspekte geschaut, beispielsweise wie kann eine Suchmaschine für Forschungsdaten aussehen, wie können Identifikatoren für Forschungsdaten gemanaged werden usw.

Und jüngst hat man die EOSC Association ins Leben gerufen. Das ist jetzt eine wirklich eine formale Einrichtung, eine Stiftung unter belgischem Recht, angesiedelt in Brüssel. Die hat jetzt die Aufgabe, all die Aktivitäten, die es in der Vergangenheit gab, in Zukunft geben wird, zu bündeln. Und das ist festgeschrieben in einem sogenannten SRIA, das ist das Strategic Research and Innovation Agenda. Das ist also das Dokument, das festlegt, für die nächsten Jahre was zu tun ist. Und alle Projekte, wie beispielsweise das Future-Projekt „EOSC Future“, haben sich danach zu richten und daran zu orientieren.

[00:08:08] Doreen Siegfried:
Okay und gibt’s eine Art Zeitplan, wann sozusagen so ein erster Prototyp schon mal vorzeigbar ist?

[00:08:15] Klaus Tochtermann:
Ja, also die EOSC selbst ist unterteilt in verschiedene Ebenen. Die Kernebene ist das sogenannte EOSC Core, da sind Kernfunktionalitäten drin, beispielsweise, dass man suchen kann, dass man Forschungsdaten speichern kann, dass man sich einloggen kann, also Basisfunktionalität. Und darüber hinaus gibt es dann EOSC Exchange. Das ist der nächste Level, da sind komplexere Services abgebildet, beispielsweise Services für spezielle Datenanalysen. Und die SRIA, also dieses Dokument, diese Agenda, dieser Entwicklungsplan, der legt sehr genau fest, zu welchem Zeitpunkt was verfügbar sein soll. Und EOSC Core, also die Kernfunktionalität, die soll von jetzt abgerechnet in zwei Jahren beispielsweise stehen.

[00:09:03] Doreen Siegfried:
Okay, also 2023 wäre das dann.

[00:09:07] Klaus Tochtermann:
Ja.

[00:09:08] Doreen Siegfried:
Okay. Das ist ja, das ist ja sozusagen übermorgen, gefühlt.

[00:09:12] Klaus Tochtermann:
Bezogen auf die Geschwindigkeit, in der wir uns bewegen, wenn man bedenkt, wir haben 2023 vor acht Jahren begonnenen, kann man es, je nachdem, wie man es beleuchtet, als schnell oder nicht so schnell bewerten. Das überlasse ich mal unseren Zuhörer:innen.

[00:09:27] Doreen Siegfried:
Ja, okay. Wenn man sich jetzt so die Diskussionen um das ganze Thema Open Science und so weiter der vergangenen Jahre anguckt, dann stellt sich mir die Frage, also EOSC steht ja für European, für Open, für Science und für Cloud: passen diese Begrifflichkeiten, die man sich irgendwie 2015 überlegt hat, passen die noch auf das, was die EOSC heute ausmacht?

[00:09:53] Klaus Tochtermann:
Also die Begrifflichkeiten EOSC haben schon 2015 nicht gepasst. Also wir haben ja nur gesagt, die European Open Science Cloud ist nicht European, ist nicht Open, ist nicht Science und ist nicht Cloud. Und das stimmt heute immer noch. Sie ist nicht European, weil Forschung nicht an regionalen Grenzen Europas endet, sondern viele Forschungsgruppen sind international vernetzt. Sie ist nicht Open, weil es auch in der Wissenschaft Daten gibt, die einen Schutzbedarf haben, beispielsweise Patientendaten. Sie ist nicht Science, weil viele wissenschaftliche Forschungsprojekte auch Daten aus der Wirtschaft nutzen. Und sie ist nicht Cloud, weil es nicht darum geht, alle Daten zentral in einer Cloudlösung abzulegen. Ist halt ein Begriff, der quasi vorgegeben wurde damals von der Europäischen Kommission, der sich jetzt soweit gesetzt und verbreitet hat, dass es auch nicht mehr zu ändern ist.

[00:10:50] Doreen Siegfried:
Aber es wäre denn sowas, wenn ich jetzt mal zusammenfasse, eher sowas wie ein Global Fair General Portal oder so was in der Art.

[00:10:59] Klaus Tochtermann:
Ja, oder was wir auch manchmal sagen, ein Internet of FAIR Data and Services. Also dass man eben ein Internet hat, das primär fokussiert auf die faire, entsprechend der FAIR-Prinzipien, Behandlung von Daten und Anbieten entsprechender Services: IFDS – Internet of FAIR Data and Services.

[00:11:24] Doreen Siegfried:
Ah ja, okay. Wissenschaftler und Wissenschaftlerinnen, die jetzt schon neugierig sind, haben die die Möglichkeit, sich irgendwie zu beteiligen an der Entwicklung oder an ersten Tests oder an ersten Prototypen?

[00:11:38] Klaus Tochtermann:
Also da gibt’s zwei Bereiche. Einmal, wenn man sich informieren will, gibt’s das EOSC Portal (eosc-portal.eu). Das ist tatsächlich ein Informationsportal über Angebote, die später in der EOSC eine Rolle spielen werden. Da sind beispielsweise aufgeführt, welche Forschungsdaten-Repositorien gibt es denn in Europa? Welche Dienste, also Services, gibt es in Europa, die man nutzen kann. Das ist eine, sagen wir, eine Informationsplattform über die EOSC.

Wenn man sich selbst aktiv einbringen will, hat die EOSC Association, also diese Stiftung, die jetzt die EOSC vorantreibt, sogenannte Advisory Groups in ihren Statuten vorgesehen. Das sind also Gruppierungen, die an einzelnen Themen arbeiten. Aus der EOSC Association heraus haben wir, ich glaube, 6 Advisory Groups, 6 thematische, ins Leben gerufen und darunter gibt es sozusagen Unterarbeitsgruppen, um es konkret zu machen. Eine Arbeitsgruppe entwickelt sich mit Curricula im Bereich Forschungsdatenmanagement. Eine andere Unterarbeitsgruppe beschäftigt sich mit Metadatenstandards. Wieder eine andere mit den FAIR-Prinzipien. Und wir haben einen offenen Aufruf gemacht, sich in diesen Arbeitsgruppen zu beteiligen.

[00:13:00] Doreen Siegfried:
Ah ja, okay.

[00:13:01] Klaus Tochtermann:
Und wir hatten, Stand letzter Woche, knapp 500 Bewerbungen von Forschenden aus ganz Europa. Die meisten Bewerbungen kamen aus Frankreich mit 18 Prozent aller Bewerbungen. Deutschland, das interessiert unsere Zuhörer:innen vielleicht, Deutschland ist mit 17 Prozent der Bewerbungen auf Platz zwei. Also da sieht man, in Deutschland wird das angenommen und das ist der typische Mechanismus zur Beteiligung. Und jetzt werden die quasi die entsprechenden Arbeitsgruppen konstituiert. Wir können natürlich nicht Arbeitsgruppen von 100 Personen haben. Das ist unterschiedlich, variiert immer. Die Arbeitsfähigkeit einer Arbeitsgruppe muss halt gewährleistet sein. Aber jetzt wird quasi ausgewählt, wer in welche dieser Arbeitsgruppen kommt.

[00:13:49] Doreen Siegfried:
Ja, okay. Also wer früher zu Erasmuszeiten noch nicht auf seine Kosten gekommen ist, kann jetzt den europäischen Gedanken pflegen und sich da auch noch weiter bewerben für diese Arbeitsgruppen. Es gibt ja in Deutschland, ich hatte es ja anfangs schon erwähnt, dass du ja Mitglied bist beim RfII, wo auch dann letztlich die Nationale Forschungsdateninfrastruktur erdacht wurde. Also es gibt in Deutschland die ersten Konsortien zur Bildung der Nationalen Forschungsdateninfrastruktur, NFDI. Zudem gibt es auch noch Gaia-X, die vernetzte Datenstruktur für Wissenschaft, Politik und vor allem Wirtschaft. Wie spielen diese drei jetzt alle zusammen?

[00:14:37] Klaus Tochtermann:
Ja, das ist in der Tat eine für Außenstehende mitunter unübersichtliche Gemengelage. Vor allen Dingen, wenn man berücksichtigt, dass auf Ebene der Europäischen Kommission inzwischen weitere Initiativen ins Leben gerufen werden, die auch so eine Cloudlösung anbietet, speziell eben im Bereich der Wirtschaft. Aber wir bleiben mal bei den dreien. Also, EOSC haben wir schon drüber gesprochen, das ist die europäische Infrastruktur.

Nationale Forschungsdateninfrastruktur, NFDI, das ist eben die Infrastruktur in Deutschland für das Management von Forschungsdaten. Und wenn wir hier in Deutschland über Infrastruktur reden, also NFDI, dann meinen wir nicht nur die technische Infrastruktur, sondern wir meinen auch die Vernetzung von Personen. Also die Vernetzung der Wissenschaftscommunity im Rahmen der nationalen Forschungsdateninfrastruktur, also es ist nicht nur eine technische Betrachtungsweise. Und die NFDI die gestaltet sich entlang der einzelnen Disziplinen. Also es gibt Konsortien oder Projekte im Bereich der Chemie, im Bereich der Wirtschaftswissenschaften und Sozialwissenschaften, im Bereich der Materialwissenschaften. Die Informatik ist auch mit einem Konsortium vertreten. Also das ist ein disziplinärer Gedanke, der dort quasi federführend ist. Und über ein NFDI-Direktorat, wieder so eine zentrale Koordinationsstelle, soll über die Jahre dazu beigetragen werden, dass diese Initiativen auch ineinanderwirken. Das ist die NFDI.

Die Gaia-X ist insbesondere eine Initiative, die zum Ziel hat, Unternehmen in Deutschland und Europa eine europäische Infrastruktur für das Management, also Speichern beispielsweise ihrer Daten, anzubieten, weil eben sehr viele ausweichen in Angebote aus Amerika oder China. Ein weiteres Merkmal von Gaia-X neben der Zielgruppe Wirtschaft – also NFDI hat nicht die Zielgruppe Wirtschaft, EOSC auch nur in Teilen – neben diesem Ziel die Wirtschaft anzusprechen, wird ein großer Schwerpunkt auf sogenannte Datensouveränität gelegt. Datensouveränität heißt, wenn ich Daten bereitstelle, kann ich jederzeit nachverfolgen, wer meine Daten für welche Zwecke verwendet. Und wenn ich es nicht möchte, kann ich auch sagen, da sollen meine Daten nicht hingehen. Das ist z.B. ein Thema, was wir in der NFDI oder in der EOSC nicht betrachten, also da ist Datensouveränität nicht so prominent wie in Gaia-X vereinigt. Technisch haben alle drei was miteinander zu tun. Das ist klar, weil es halt auch um eine technische Infrastruktur geht.

Und vor dem Hintergrund gibt es in Deutschland inzwischen schon ein Projekt „FAIR Data Spaces“ heißt das vom BMBF und BMWi angestoßen und finanziert. „FAIR Data Spaces“ ist ein Projekt, an dem die ZBW auch beteiligt ist, das zum Ziel hat, NFDI und Gaia-X zusammenzuführen in einem Pilotbereich. Auf europäischer Ebene gibt es auch eine Reihe von Workshops, um EOSC und Gaia-X zusammenzubringen.

[00:17:52] Doreen Siegfried:
Ah ja. Okay. Okay. Das heißt, wenn du sagst, die NFDI beschäftigt sich jetzt nicht nur mit den technischen Infrastrukturen, sondern bringt auch die Leute letztlich zusammen, dann sind das wahrscheinlich so Themen wie Ausbildung, Data Literacy und sowas. Oder zu welchen Themen tauschen sich die Leute da eben auch Disziplinen, ja, tauschen die sich nur in ihrer jeweiligen Disziplin aus oder auch disziplinübergreifend?

[00:18:24] Klaus Tochtermann:
Gerade auch disziplinübergreifend, weil es in so einer Infrastruktur Themen gibt, die alle betreffen, völlig unabhängig davon, in welcher Disziplin sie tätig sind. Und solche Themen sind beispielsweise digitale Langzeitarchivierung von Forschungsdaten. Das ist themen-, also ist disziplinunabhängig. Ein anderes Feld ist die Vergabe von eindeutigen Identifikatoren für einen Datensatz, ist auch unabhängig von der Disziplin. Und ein weiteres ist, dass man quasi nur ein Login hat. Also Single Login oder Single Sign-In für diese Forschungsdateninfrastruktur NFDI. Also wenn man sich dann vorstellt, wir haben diese vielen disziplinären Angebote, will ich ja nicht 30 Accounts haben, über die ich mich einloggen kann, sondern ich will dann ein Single Sign-On. Und wenn ich da drin bin in der NFDI, kann ich auf alle angeschlossenen Forschungsdaten-Repositorien zugreifen. Das sind so übergreifende Themen und die werden genau koordiniert vom NFDI Direktorat. Da gibt es entsprechende Arbeitsgruppen und die bestehenden Konsortien sind eingeladen, sich in solchen Arbeitsgruppen einzubringen.

[00:19:29] Doreen Siegfried:
Das heißt auch in der NFDI, selbst wenn die jetzt nur so in ihren  Fachcommunities sich austauschen, muss man sich am Ende dann doch wieder Gedanken machen über Metadaten. Also wenn ich jetzt am Ende mit so einem Single Login Daten finden will zu einem Thema aus unterschiedlichen Disziplinen, muss ich da irgendwie eine gemeinsame Sprache haben, um dann die richtigen Sachen zu finden.

[00:19:53] Klaus Tochtermann:
Genau. Der Fachbegriff dafür ist Interoperabilität.

[00:19:56] Doreen Siegfried.
Ja.

[00:19: 57] Klaus Tochtermann:
Man will eben quasi an einer Stelle suchen, eine Suche starten. Und eigentlich muss es mir egal sein, wo im Hintergrund die Daten liegen. Ich will sie finden, ohne Kenntnis darüber zu haben, wo die jetzt eigentlich genau gesucht werden. Wenn ich von meiner Stelle um einen zentralen Einstiegspunkt die Suche starte, soll das alles, was im Hintergrund angeschlossen ist, durchsucht werden und mir als Ergebnis geliefert werden. Das erfordert ja Interoperabilität der Systeme, einheitliche Metadatenstandards, einheitliche Protokolle. Und darum geht es eben auch in der NFDI, wenn diese Einzelangebote, diese disziplinären später zusammengeführt werden.

[00:20:35] Doreen Siegfried:
Ja, okay. Was würdest du denn jetzt beispielsweise Wirtschaftsforschenden raten, die so mitten in diesem ganzen Thema Forschungsdatenmanagement stecken? Also, die haben jetzt ja ihre Daten erhoben, wollen die öffentlich verfügbar machen, also anderen Wissenschaftlerinnen und Wissenschaftlern zugänglich, müssen die natürlich entsprechend aufbereiten. Gibt’s da schon irgendwelche flankierenden Services oder Gelder für die man sich bewerben kann, um vielleicht Personal einzukaufen? Für, ja, für Datenmanagementaufgaben?

[00:21:17] Klaus Tochtermann:
Also ein guter Einstiegspunkt sind die entsprechenden Webpräsenzen der großen wirtschaftswissenschaftlichen Konsortien. Da gibt es zwei: es gibt das KonsortSWD für die Sozialwissenschaften, Bildungsforschung, Wirtschaftswissenschaften, das sehr eng gekoppelt ist an den RatSWD, den Rat für sozial- und wirtschaftswissenschaftliche Daten mit seinen zertifizierten Forschungsdatenzentren. Dort hatten wir tatsächlich aus Projektmitteln heraus jüngst einen Call über den sich die Forschungsdatenzentren, so heißt das im Kontext vom RatSWD, bewerben konnten, um Mittel zu bekommen für genau solche Zwecke, wie du sie genannt hast.

Das zweite große Konsortium ist BERD. Da geht es um die Forschungsdaten, ja, wir haben einen sehr starken BWL-Fokus, aber die Forschungsdaten sind auch BWL-unabhängig, weil es sind all die Daten, die der BERD behandelt, die ursprünglich nicht für Forschungszwecke generiert wurden. Z.B. Twitterdaten oder Daten aus Geschäftsberichten wurden ja nicht generiert, um Forschung drauf zu machen. Aber für Forschende ist das interessant, diese Daten zu analysieren. Und da das Projekt beginnt jetzt erst. Wir sind im Moment in den Verhandlungen für den Kooperationsvertrag. Es ist uns also bewilligt worden. Offizieller Projektstart ist der 1.10. diesen Jahres 2021. Und unser Ziel ist es dann in der Tat sehr, sehr schnell genau so eine Plattform anzubieten, wo dann Forschungsdaten einfach abgelegt werden können und dann wird nach und nach werden eben Services angeboten, die auf diesen Forschungsdaten etwas liefern können. Weil die Umfragen in der Community, die Workshops, die die Kollegen von der Universität Mannheim durchgeführt haben, sehr klar hervorgebracht haben, da ist ein riesen Bedarf gerade für Nachwuchsforschende, sie dahingehend zu unterstützen, ihre Forschungsdaten irgendwo ablegen zu können jenseits der lokalen Festplatte. Und dass ist ein Bedarf, den BERD sehr schnell bedienen möchte.

[00:23:18] Doreen Siegfried:
Ja, okay. Das heißt, wenn ich jetzt sozusagen nochmal mit der Brille eines Wirtschaftsforschenden gucke und jetzt nicht nur, gehen wir mal nochmal einen Schritt zurück in diesen Forschungsprozess, also ich habe jetzt noch keine Forschungsdaten, sondern ich möchte jetzt welche von anderen nachnutzen oder meinetwegen auch Unternehmensdaten oder Statistiken nachnutzen. Würdest du dann eher empfehlen, in BERD danach zu gucken oder dann doch eher in Gaia-X, weil dort auch Wirtschaftsdaten liegen? Oder sind die dann am Ende durch dieses FAIR Data Projekt sowieso am Ende alle miteinander vernetzt?

[00:24:02] Klaus Tochtermann:
In Gaia-X werden vorwiegend Daten von Unternehmen abgelegt. Also deren eigene Daten. Das ist das. In BERD demgegenüber werden Daten abgelegt, die irgendeinen Unternehmensbezug haben, aber nicht unbedingt von den Unternehmen kommen. Also beispielsweise Twitter, wenn ich da eine Analyse fahren will, wie stark meine Getränkefirma in Tweets beispielsweise genannt wird. Das sind, dann werden diese Tweets tatsächlich Daten, die in BERD später zu finden sind, weil das ja auch keine Daten sind, die der Getränkefirma gehören, sondern das sind ja welche von Twitter. Insofern ist die Qualität der Daten schon unterschiedlich. Auch bei Gaia-X. Das wird keine Infrastruktur sein, nach meiner Erwartungshaltung Stand heute, wo Individuen, also Forschende ihre Daten ablegen können, das ist halt ausgerichtet auf Unternehmen. Während NFDI durchaus den einzelnen Forschenden eine Möglichkeit anbietet, ihre Forschungsdaten abzulegen.

[00:25:08] Doreen Siegfried:
Aber sie können dort welche theoretisch finden, die sie für ihre Forschungszwecke nutzen könnten?

[00:25:12] Klaus Tochtermann:
Genau. Und da muss man halt bei Gaia-X schauen, wie offen zugänglich sind die, welchen Schutzbedarf haben die. Und in Abhängigkeit davon können sie eben nachgenutzt werden oder nicht, ja.

[00:25:24] Doreen Siegfried:
Ja, okay. Das ist ja sozusagen jetzt mal der deutsche Blick, der schon hinreichend komplex ist, was hier alles gerade so losgeht. Wie sieht das denn aus woanders auf der Welt? Also gibt es ähnliche Bestrebungen auch in anderen Ländern Europas oder auch nicht nur Europas, wir wollen ja den weltweiten Blick wagen, auf anderen Kontinenten?

[00:25:46] Klaus Tochtermann:
Ja, ich glaube, Europa können wir schnell abhaken. Das ist die EOSC, da sind alle mit dabei. Schauen wir auf die anderen Weltregionen und ja, es gibt ähnliche Bestrebungen. Es gibt in China die Chinese Science and Technology Cloud, (CSTCloud). Es gibt in Afrika die African Open Science Cloud. Es gibt entsprechende Bestrebungen in Australien und in den Staaten. Das gibt es. Und damit die alle zusammengeführt werden, ist jüngst eine Initiative gestartet worden, die heißt Global Open Science Cloud.

[00:26:24] Doreen Siegfried:
Ja, okay.

[00:26:25] Klaus Tochtermann:
Die wird koordiniert vom Amerikaner George Strawn. Und in Europa von Jean-Claude Burgelman, der früher bei der Kommission war, sozusagen das Mastermind hinter der European Open Science Cloud. Die koordinieren die Gruppe. Und da sind drin sozusagen die leitenden Figuren dieser regionalen Open Science Cloud-Bestrebungen. Damit verbunden ist das Ziel, dass man frühzeitig auch schaut, dass diese regionalen Cloud-Lösungen in der European Open Science Cloud mit einer afrikanischen, mit einer australischen, mit einer chinesischen zusammenspielt. Also da gibt es entsprechende, also da gibt’s eine große Expertengruppe, die sich damit befasst, die in diesem Jahr ihre Arbeit aufgenommen hat.

[00:27:05] Doreen Siegfried:
Ja, okay. Und in dieser Global Open Science Cloud, welche Rolle nehmen da jetzt beispielsweise so Länder ein wie China versus USA, die ja jetzt nicht nur bei Olympia im Wettstreit standen, sondern ja auch sonst miteinander konkurrieren?

[00:27:35] Klaus Tochtermann:
Ja, also das, in China gibt’s eben dieses große Projekt Chinese Science and Technology Cloud. LI Jianhui koordiniert das, ist auch Vizepräsident von CODATA, ist also auch eine gewisse Öffnung dem Westen gegenüber. George Strawn, wie gesagt, ist von den Amerikanern. Ich glaube, im Wissenschaftssystem ist das unkompliziert. Man nennt das ja auch Science Diplomacy, also, dass man eben, auch wenn es auf politischer Ebene zwischen Staaten Anspannungen gibt, man in der Wissenschaft, einfach, weil man wissenschaftsgeleitet arbeitet, von diesen Anspannungen nichts merkt. Ich weiß nicht genau, wie die ersten Gespräche in dieser großen Runde gelaufen sind. Ich erwarte aber, da alle sehr zustimmend diesem Konzept und diesem Vorschlag von uns gefolgt sind, dass man sehr konstruktiv in Gespräche gehen wird.

[00:28:17] Doreen Siegfried:
Ja, okay. Ja, spannend. Vielleicht nochmal ganz kurz zurück zu uns in Europa. Also, wie wird, wie finanziert, du hast ja gesagt, am Anfang konnten nur kleinere Projekte erst einmal umgesetzt werden, weil die Finanzierung entsprechend das nicht anders zuließ. Wie wird dann jetzt die European Open Science Cloud finanziert? Also „EOSC Future“ und so weiter?

[00:28:44] Klaus Tochtermann:
Ja, also die Finanzierung ist festgehalten in einem Memorandum of Understanding, also einer Vereinbarung zwischen der EOSC Association und der Europäischen Kommission. Die haben ja verhandelt, von Dezember bis jetzt im Juni. Und in dieser Vereinbarung sind auch die finanziellen Beiträge beider Parteien festgelegt. Die EOSC Association hat sich verpflichtet, über ihre Mitgliedsstaaten, also die 28 Mitgliedsstaaten, 500 Millionen Euro als In-kind-Leistung in die EOSC bis zum Jahr 2030 zu investieren, also über die nächsten zehn Jahre. Und umgekehrt hat die Europäische Kommission ebenfalls sich verpflichtet, 500 Millionen Euro Cash für zukünftige Forschungsprojekte in Horizon Europe zur EOSC bereitzustellen. Also von beiden Seiten 500 Millionen Euro in den nächsten zehn Jahren, sodass man in Summe auf eine Milliarde kommt für den Aufbau der European Open Science Cloud.

[00:29:57] Doreen Siegfried:
Ja, Wahnsinn. Und wie funktioniert das Zusammenspiel zwischen Europäischer Kommission und EOSC Association?

[00:30:04] Klaus Tochtermann:
Wie das Zusammenspiel funktioniert, da muss ich jetzt eine diplomatische Antwort finden.

[00:30:07] [beide lachen]

[00:30:09] Klaus Tochtermann:
Weil wir ja auch eine große Reichweite mitunter haben, also das Zusammenspiel funktioniert natürlich hervorragend. Wir sind ständig in konstruktiven …

[00:30:17] Doreen Siegfried:
Freundschaftlich und konstruktiv…

[00:30:20] Klaus Tochtermann:
Genau. … konstruktiven Gesprächen. Manchmal haben wir in der EOSC Association wenig Zeit zu reagieren, weil man heute ein Dokument bekommt, das in drei Tagen finalisiert werden soll. Da bin ich sehr froh, dass wir einen sehr starken Präsidenten der EOSC Association haben, der auch das Rückgrat hat, dass wir nicht immer mit solchen kurzen Zeitfenstern konfrontiert sind, wo mitunter Reaktionen einfach nicht möglich sind, weil die Thematik zu komplex ist. Aber insgesamt funktioniert es gut. Man muss auch dazu sagen, dass diese Form der Zusammenarbeit, das läuft formal in einem Partnership-Modell der Europäischen Kommission. Das ist auch ein neues Modell der Kooperation der zwischen der Kommission und den Mitgliedsstaaten. Das muss wirklich von beiden Seiten auch noch ein bisschen, ja, mit Erfahrung gefüllt werden. Ist wirklich für beide Seiten neu.

[00:31:14] Doreen Siegfried:
Ja, okay. Dann vielleicht noch eine Frage zur EOSC Association. Also die wurde ja gerade erst einmal letztes Jahr, ich glaube, im Juli war das, im Sommer, ja ungefähr vor einem Jahr gegründet, um auch so ein bisschen mit einer Stimme zu sprechen und auch die breite Gemeinschaft der EOSC Stakeholder zu vertreten. Jetzt 2021, hat diese EOSC Association ihre Arbeit aufgenommen und auf der Webseite wird auch um Mitglieder geworben. Also, wie viele, wie viele Mitglieder sind denn jetzt schon involviert? Es läuft ja jetzt noch nicht lange, das mal für unsere Zuhörerinnen und Zuhörer dazugesagt. Also, aber wie viele haben sich jetzt schon dazu gemeldet?

[00:31:56] Klaus Tochtermann:
Wir haben über den Daumen 200 Mitglieder.

[00:32:00] Doreen Siegfried:
Ja.

[00:32:00] Klaus Tochtermann:
Mitglied sind nicht Einzelpersonen, sondern Organisationen wie beispielsweise die ZBW oder der NFDI-Verein in Deutschland. Das sind die Mitglieder. Bei den Mitgliedern unterscheidet man noch zwischen zwei Arten, man kann Vollmitglied sein, dann ist man überall stimmberechtigt und zahlt derzeit einen Betrag von 10.000 Euro pro Jahr. Man kann Observer sein. Dadurch ja, wie der Name schon sagt, hat man eher eine beobachtende Rolle, darf aber z.B. in der Generalversammlung nicht mit abstimmen. Als Observer zahlt man 2.000 Euro. Ich glaube, unsere Hochrechnungen haben ergeben, dass wir, wenn wir jetzt alle Mitgliedsbeiträge einsammeln, mit einem Jahresbudget von 1,5 Millionen Euro starten können.

[00:32:46] Doreen Siegfried:
Ah ja, okay.

[00:32:47] Klaus Tochtermann:
Das in der EOSC Association zur Verfügung steht, weil wir ja auch in der Geschäftsstelle davon dann Personal aufbauen wollen. Im Moment machen das ja alles die Mitglieder des Board of Directors, aber das können wir dauerhaft nicht durchhalten. Weil, wie du eingangs sagtest, wir haben alle einen Hauptjob, den wir auch noch machen müssen.

[00:33:05] Doreen Siegfried:
Ja ja, ihr seid acht Personen, ne?

[00:33:06] Klaus Tochtermann:
Genau acht Personen. Ja ja.

[00:33:09] Doreen Siegfried:
Das ist auch keine Riesentruppe. Okay, ja, super. Okay. Letzte Frage: jetzt auch für unsere Zuhörerinnen und Zuhörer, die sich wahrscheinlich überhaupt nicht so gut mit Wissenschaftspolitik oder schon gar nicht europäischer Wissenschaftspolitik auskennen. Zumindest nicht in dieser Tiefe. Also, hast du so drei Sachen, ich sag mal so Angeberwissen, was man so auf einer Party oder sowas mal fallen lassen kann, nach dem Motto „Wussten Sie schon?“ –  European Open Science Cloud – so drei Facts?

[00:33:38] Klaus Tochtermann:
Ja, das erste ist vielleicht: Wussten Sie schon, dass wir in Europa 500.000 Forschungsdatenexperten und -expertinnen benötigen in Zukunft? Also wir haben da eine riesige Lücke für dieses neue Berufsfeld. Das ist das erste. Das zweite, was ich vorhin sagte: Wussten Sie, dass für den Aufbau der European Open Science Cloud eine Milliarde Euro für die nächsten zehn Jahre zur Verfügung stehen?

[00:34:13] Doreen Siegfried:
Ja.

[00:34:13] Klaus Tochtermann:
Und das dritte vielleicht: Wussten Sie, dass die European Open Science Cloud weder European noch Open noch Science noch Cloud ist?

[00:34:23] [beide lachen]

[00:34:24] Doreen Siegfried:
Ja genau. Ja wunderbar. Herzlichen Dank! Ich bedanke mich für diesen, für diesen kurzen, aber doch wahnsinnig komplexen Tiefgang zum Thema European Open Science Cloud und natürlich auch Global Open Science Cloud. Und auch vielen Dank, vielen Dank da draußen. Ich hoffe, es hat Ihnen gefallen. Lassen Sie uns gerne Kommentare da, Sie finden wie immer alle Links, alle Kommentare, alle Hinweise in den Shownotes. Abonnieren Sie uns fleißig auf iTunes oder Spotify oder wo auch immer man Podcasts finden kann. Und ich freue mich aufs nächste Mal.