Datenraum Medien
Vom Pilotprojekt zur souveränen europäischen Medieninfrastruktur
Im Mediensektor verdichten sich derzeit mehrere Herausforderungen, die sich gegenseitig verstärken: Erstens wächst der Druck, digitale Wertschöpfung unabhängiger von dominanten Plattformökosystemen zu gestalten. Zweitens steigen die Anforderungen an die Fähigkeit, Inhalte und Daten verantwortungsvoll für KI-gestützte Prozesse zu nutzen – von Personalisierung bis hin zu Erkennung von Manipulation. Drittens nimmt die Bedrohung durch synthetische Medien und Deepfakes zu und erhöht den Bedarf an verlässlichen Prüfmechanismen. Die europäische Datenraum-Strategie benennt den Mediensektor daher explizit als einen Bereich, in dem Datenräume entstehen, um Datenzugang und Wiederverwendung in einem europäischen, vertrauenswürdigen Rahmen zu ermöglichen . Gleichzeitig weist etwa die UNESCO auf Risiken für Informationsintegrität hin, die ohne robuste technische und organisatorische Gegenmaßnahmen demokratische Prozesse erschweren können . Auf der wirtschaftlichen Seite unterstreicht der 2022/2025 World Trends Report, Journalism: Shaping a World at Peace der UNESCO, dass Plattformabhängigkeiten und die Konzentration digitaler Werbe- und Distributionsmacht die Verhandlungsmacht klassischer Medienakteure schwächen und damit Fragen digitaler Souveränität aufwerfen .
Um diesen strukturellen Defiziten im Mediensektor zu begegnen, initiierte MISSION KI gemeinsam mit führenden öffentlich-rechtlichen und privaten Medienhäusern (ARD, ZDF, RTL Deutschland, ProSiebenSat.1 und die Deutsche Presse-Agentur dpa) 2025 ein Pilotprojekt. Unterstützt wurde die acatech durch die Behörde für Kultur und Medien Hamburg, die Mitinitiatoren der Beyond Platforms Initiative und das Fraunhofer-Institut für Software- und Systemtechnik ISST. Ziel des Pilotprojekts war der „Proof of Concept“ für eine föderierte, dezentrale Dateninfrastruktur. Bis Oktober 2025 wurden die technischen und organisatorischen Grundlagen gelegt und der technische Beweis erfolgreich an fünf komplexen, prototypischen Anwendungen erbracht: Ein sicherer, datenschutzkonformer Austausch zwischen Wettbewerbern ist nicht nur möglich und technisch machbar sondern auch ökonomisch vorteilhaft.
DIE 4 KERNPRINZIPIEN des Datenraum Medien
Damit der Datenraum Medien als vertrauenswürdige Alternative zu geschlossenen Plattformen funktioniert, basiert er auf fünf Grundsätzen, die in der Pilotphase technisch verankert wurden:
1. Datensouveränität (Control via Policy)
In der Plattformökonomie verlieren Anbieter oft die Kontrolle über ihre Daten, sobald sie hochgeladen werden. Im Datenraum Medien gilt: Der Datengeber behält die volle Hoheit. Jeder Datensatz ist mit einem maschinenlesbaren Vertrag (Policy) verknüpft, der technisch durchgesetzt wird. Der Urheber bestimmt granular: Wer darf zugreifen oder das Datenangebot über sehen? Zu welchem Zweck (z. B. nur Forschung, kein kommerzielles Training)? Und für wie lange? Ohne aktives "Ja" fließt kein Byte.
2. Föderierte Dezentralität (No Central Data Lake)
Es gibt keinen zentralen Server, auf dem alle Medieninhalte Deutschlands gespeichert werden. Die Architektur ist föderiert: Daten verbleiben physisch in den Systemen der jeweiligen Medienhäuser. Der Austausch findet direkt zwischen den Partnern statt ("Peer-to-Peer"), verschlüsselt und sicher. Dies verhindert "Single Points of Failure", erhöht die Resilienz gegen Cyberangriffe und respektiert die föderale Struktur der Medienlandschaft.
3. Neutralität & Diskriminierungsfreiheit
Der Betreiber der Datenraum-Infrastruktur selbst hat keine eigenen Geschäftsinteressen an den Inhalten. Sollte der Datenraum Medien künftig weiter ausgebaut werden, kann die Infrastruktur durch die acatech Stiftung als neutralen Treuhänder betrieben. Dies garantiert, dass der Zugang diskriminierungsfrei erfolgt: Ein kleines Start-up oder ein Lokalverlag erhält dieselben technischen Zugangsmöglichkeiten und Konditionen wie eine große Sendergruppe. Es gibt keine algorithmische Bevorzugung durch den Betreiber.
4. Interoperabilität & Offene Standards
Um den "Vendor Lock-in" zu brechen, setzt der Datenraum konsequent auf Open Source (Eclipse Dataspace Components) und offene Standards (IDSA, Data Space Protocoll, W3C ODRL). Das bedeutet: Teilnehmer können ihre Technologieanbieter frei wählen und jederzeit wechseln. Wer heute einen Konnektor von Anbieter A nutzt, kann morgen zu Anbieter B wechseln, ohne seine Verbindungen im Datenraum zu verlieren. Dies fördert einen lebendigen Wettbewerb der Technologiedienstleister.
ERGEBNISSE 2025
Die 5 Pilot-Anwendungen im Detail
In der Pilotphase wurden technische und organisatorische Grundlagen entlang konkreter Anwendungsfälle praktisch erprobt. Die fünf prototypische Anwendungen haben den „Proof of Value“ erbracht und zeigen das enorme Potenzial:
1. Kooperatives KI-Training (GenAI)
Herausforderung: Einzelne Medienhäuser verfügen oft nicht über ausreichende oder ausreichend diverse Datenmengen, um leistungsfähige, deutschsprachige Sprachmodelle (LLMs) zu trainieren, die journalistischen Qualitätsansprüchen genügen.
Lösung 2025: ARD, ZDF und dpa bündelten ihre Artikel-Archive virtuell über den Datenraum, um gemeinsam ein KI Modell zur automatisierten Teaser-Erstellung zu entwickeln. Dabei kam das Prinzip „Compute-to-Data“ zum Einsatz: Die Daten verließen nie die Hoheit der jeweiligen Häuser. Stattdessen „reiste“ der Algorithmus zu den Daten, um ein Modell für die automatisierte Teaser-Erstellung zu trainieren.
Erkenntnis: Das auf diesen aggregierten Daten trainierte KI-Modell lieferte signifikant bessere, bias-ärmere und präzisere Ergebnisse bei der Teaser-Erstellung als isolierte Modelle und näherte sich der Qualität führender Hyperscaler-Modelle an.
Fazit: Kooperation im vorwettbewerblichen Bereich ist der einzige Weg zu einer wettbewerbsfähigen, europäischen KI-Souveränität.
2. Gemeinsame Nachrichtenverifizierung
Herausforderung: In Krisenzeiten prüfen oft hunderte Redaktionen parallel dieselben Nachrichten (z.B. KI-generierte Fake-News-Videos). Dies ist eine massive Verschwendung journalistischer Ressourcen.
Lösung 2025: Etablierung eines geteilten Metadaten-Pools unter Nutzung des C2PA-Standards (Content Credentials). Sobald eine Redaktion (z.B. dpa) ein Video verifiziert oder als Fälschung entlarvt, wird dieser Status (der „Prüfstempel“) kryptographisch gesichert im Datenraum geteilt.
Erkenntnis: Im Testzeitraum konnte die mehrfache Prüfung derselben Desinformation erfolgreich verhindert werden. Die Reaktionsgeschwindigkeit auf Desinformationskampagnen stieg messbar.
Fazit: Massive Effizienzgewinne durch „Shared Services“ stärken die Wehrhaftigkeit der demokratischen Öffentlichkeit.
3. Datenschutzkonforme Nutzersegmentierung
Herausforderung: Das Ende der Third-Party-Cookies erschwert die zielgerichtete Ansprache von Nutzern. US-Plattformen nutzen hierfür ihre geschlossenen Login-Bereiche ("Walled Gardens").
Lösung 2025: Der Einsatz eines neutralen technischen Treuhänders (Trustee) im Datenraum ermöglichte die Zusammenführung von First-Party-Daten (z.B. Interessenprofile) unter strikter Einhaltung der DSGVO. Daten wurden verschlüsselt, aggregiert und anonymisiert ausgewertet.
Erkenntnis: Es ist möglich, präzise Zielgruppenanalysen für Werbe- oder Content-Zwecke zu erstellen, ohne die Privatsphäre der Nutzer zu gefährden oder Daten an US-Konzerne abfließen zu lassen.
Fazit: Ein europäischer Gegenentwurf zum Überwachungskapitalismus ist technisch machbar.
4. Integration externer Services (No Vendor Lock-in)
Herausforderung: Die technische Anbindung innovativer Dienstleister (z.B. für Personalisierung oder Paywall-Steuerung) erfordert oft monatelange Integrationsprojekte.
Lösung 2025: Die Verlags-Allianz DRIVE wurde über standardisierte Datenraum-Konnektoren als Service eingebunden. Durch die Standardisierung funktionierte die Anbindung nach dem „Plug & Play“-Prinzip.
Erkenntnis: Die Infrastruktur senkt die Transaktionskosten drastisch. Ein Wechsel des Anbieters ist einfacher möglich, was den Wettbewerb belebt.
Fazit: Die Infrastruktur verhindert den gefürchteten „Vendor Lock-in“ und fördert ein best-of-breed Ökosystem.
5. Interoperabilität („Common Data Model“)
Herausforderung: Jedes Medienhaus nutzt andere CMS-Systeme und Datenformate. Dies macht Kooperationen bisher teuer und langsam.
Lösung 2025: Entwicklung eines „Common Data Model“ für den Mediensektor – eine Art Esperanto für Mediendaten. Konnektoren übersetzen automatisch zwischen internen Haus-Formaten und dem Datenraum-Standard.
Erkenntnis: Die Integrationshürden für neue Partner sanken drastisch. Neue Use Cases konnten in Wochen statt Monaten realisiert werden.
Fazit: Standardisierung ist die zwingende Voraussetzung für Skalierung und Marktdurchdringung.
ROADMAP 2026+
Der Weg zur europäischen Basisinfrastruktur
Mit dem Abschluss der Pilotphase ist das Fundament gelegt. Der strategische Plan für die Jahre 2026/2027 sieht drei Phasen vor, um vom Projektstatus in den Regelbetrieb zu wechseln:
Phase 1: Institutionalisierung & Mittelakquise (Q1/Q2 2026)
Beantragung öffentlicher Mittel für die Basisinfrastruktur, da Marktversagen vorliegt. Überführung der Projektstrukturen in eine neutrale Trägerschaft unter dem Dach der acatech Stiftung, um Synergien mit dem Mobility Data Space zu heben
Phase 2: Aufbau & Onboarding (ab H2 2026)
Technischer Aufbau der Basisinfrastruktur (Identity Management, Clearing House) und Öffnung des Datenraums für weitere Marktteilnehmer. Fokus auf kleine und mittlere Verlage sowie Tech-Start-ups, um die Breite des Marktes abzubilden.
Phase 3: Europäische Vernetzung (2027+)
Verknüpfung mit anderen europäischen Datenräumen (z.B. Media Data Space der EU, Kultur-Datenräume), um einen grenzüberschreitenden Binnenmarkt für Mediendaten und KI-Modelle zu schaffen.
RESSOURCEN & PARTIZIPATION
Ressourcen für Entwickler & Architekten
Der vollständige Code der Referenzimplementierungen im GitHub Repository:
Projektpartner
Häufige Fragen
1. Ist das Projekt abgeschlossen?
Die Pilotphase (Machbarkeitsstudie & Proof of Concept) wurde im Oktober 2025 erfolgreich abgeschlossen. Jetzt (Stand Januar 2026) befinden sich die acatech Stiftung in der Phase der Evaluation und Planung für den möglichen Aufbau der dauerhaften Infrastruktur.
2. Warum braucht es öffentliche Gelder?
Die beteiligten Häuser haben die Entwicklung angestoßen und signifikante Eigenleistungen erbracht. Sie bilden aber nur einen Teil des Marktes ab. Um eine neutrale Infrastruktur für alle – auch kleine Lokalverlage und innovative Tech-Start-ups – bereitzustellen, ist eine öffentliche Förderung der Basisinfrastruktur notwendig. Dies verhindert, dass die Infrastruktur von wenigen Großen dominiert wird oder hohe Eintrittsbarrieren entstehen.
3. Welche Rolle spielt die acatech Stiftung?
Sie wird als neutraler Träger und Treuhänder angestrebt. Dadurch könnte der Datenraum Medien die existierende Technik des Mobility Data Space nutzen. Dies spart dem Steuerzahler Millionen an Entwicklungskosten für Basis-Komponenten und schafft Synergien zwischen verschiedenen Sektoren (z.B. Medien im Auto).
4. Was passiert mit den entwickelten Prototypen?
Die 5 Use Cases aus 2025 dienen als Blaupause und Referenzimplementierung. Sie sollen in der nächsten Phase gehärtet, in den Regelbetrieb überführt und für weitere Teilnehmer geöffnet werden, sodass aus Prototypen marktfähige Produkte werden.
5. Wie grenzt sich das Projekt von Cloud-Anbietern ab?
Der Datenraum ist keine Cloud (Speicher), sondern eine Vernetzungsschicht. Er schließt Cloud-Anbieter nicht aus, sondern integriert sie – aber nach europäischen Spielregeln. Nutzer behalten die Hoheit über ihre Daten und können den Cloud-Anbieter wechseln, ohne ihre Datenverbindungen zu verlieren.