Anzeige

Zielgenaue Recherchen im DFL-Archiv

KI hilft beim PoC »Smart Content«, die Mediensuche im Archiv für Fußballmedien noch granularer zu gestalten.

Die DFL Deutsche Fußball Liga betreibt das größte Fußball-Medienarchiv der Welt – es umfasst rund 240.000 Stunden Fußball-Content und ist somit eine attraktive und vielseitige Ressource für die etwa 75 Medienpartner der DFL in aller Welt.

©Nonkonform

Das Smart-Content-Projekt soll die Suche im DFL Fußball-Medienarchiv verbessern. 

Mit jedem neuen Spieltag wächst der Bestand an audiovisuellen Medien und Formaten weiter an und wird zugleich komplexer.

Redakteurinnen und Redakteure sind dankbar für effiziente Recherchen, insbesondere, wenn sie zeitnah zum Geschehen in mehreren Ligen berichten sollen. Deshalb ist es ein wichtiges Anliegen der DFL, ihr Archiv so bereitzustellen, dass die jeweils benötigten Inhalte für einen bestimmten Beitrag mit geringstmöglichem Zeitaufwand aufgefunden, ediert und kuratiert werden können. Dies wiederum ist ein klassisches Einsatzgebiet für KI und Ausgangspunkt des Projekts »Smart Content« der DFL. Im Sommer 2025 wurde dazu erfolgreich ein »Proof of Concept« (PoC) in Zusammenarbeit mit AWS durchgeführt.

Ziel: Optimaler Service für Medienpartner

»Wir wollen unseren Medienpartnern einen optimalen Service bieten,« meint Jan Deckenbrock, Leiter Produktinnovation der DFL GmbH. KI bietet mehrere Möglichkeiten, den Prozess zu vereinfachen. »Zunächst haben wir uns für unser Smart-Content-Projekt einen beispielhaften Content-Umfang definiert, anhand dessen wir herausfinden wollten, wie wir über Schlüsselwörter und Suchfilter hinaus den Suchvorgang optimieren könnten,« berichtet Nicklas Claus, der auf DFL-Seite wesentlich an der Umsetzung des PoC beteiligt war. Nutzerinnen und Nutzer sollen mit möglichst wenigen Vorgaben relevante Medien identifizieren können.

Metadaten eröffnen zusätzliche Nutzungspotenziale für das Archiv

Um eine intelligente, schnelle, gezielte und nahtlose Durchsuchung der Medien nach Spielerdaten, Spielerstatistiken oder wichtigen Ereignissen zu ermöglichen, müssen die Medienbestände mit Hilfe von KI mit Metadaten angereichert werden. Langfristig geht es darum, die derzeit etwa 240.000 Stunden Fußball-Content so aufzubereiten, dass die in den Abteilungen der DFL getrennt vorliegenden Metadatenquellen mittels KI orchestriert werden können und das ganze Potenzial des Archivs bequem nutzbar wird.

©DFL

So sieht das neue Suchschema aus.

Die auf Sportdaten spezialisierte DFL-Beteiligung Sportec Solutions beispielsweise stellt Ereignisdaten bereit; die DFL-Tochter Sportcast dagegen produziert während der Spiele nicht nur das Basissignal für die Bundesliga und 2. Bundesliga, sondern auch redaktionelle Metadaten. Die Zeitstempel aller dieser Daten können später als Querverweise dienen, die eine quellenübergreifende Zuordnung von Medien und Daten ermöglichen. Dem ersten PoC wurden zunächst 150 Stunden Medienmaterial aus einer Quelle zugrunde gelegt. »Unsere Aufgabe ist es nun, die Daten aus allen Quellen an einen einzigen digitalen Ort zu bringen, mit dem audiovisuellen Content zu verknüpfen und so für den Nutzenden auffindbar zu machen«, so Deckenbrock.

Eine wichtige Voraussetzung für die Generierung von Metadaten zu Spielaufzeichnungen ist die Segmentierung der Spiele in sinnvolle Szenen, denen spezifische Daten und Inhalte zugeordnet werden können. Wird die Segmentierung derzeit noch anhand der Kameraeinstellungen durchgeführt, wird mittelfristig die KI den jeweiligen inhaltlichen Kontext erkennen und zuordnen.

Intelligente Generierung von Metadaten

In einem eigenen Projekt namens IGM (Intelligent Generation of Metadata) befasste sich die DFL-Tochter DFL Digital Sports in Zusammenarbeit mit Technologiepartner AWS unterdessen mit einer weiteren Vertiefung der Metadaten durch Transkription und Bildanalysen. So können die Live-Kommentare jedes Spiels, oder auch Interviews, nach dem »Speech-to-Text«-Verfahren automatisch verschriftlicht und so ihrerseits für die Textsuche erschlossen werden. Sogar im Bild- oder Videomaterial selbst liegende Informationen wie Witterung, Emotionen, physisches Verhalten der Spieler usw. lassen sich durch Metadaten auffindbar machen. »Wir haben es geschafft, dass man in unserem Content-Bereich mit einer sogenannten semantischen Suche beispielsweise einen Spieler suchen kann, der gerade mit dem Finger nach oben zeigt,« beschreibt Claus.

Das Smart-Content-Projekt hat im Sommer 2025 die erste Proof-of-Concept-Phase mit der Vorstellung eines Prototypen abgeschlossen.

Individuelle Profile führen schneller zum Suchziel

Während die KI-generierten Metadaten die Suchbarkeit von Content optimieren, bietet KI auch die Möglichkeit, aus den Suchpräferenzen der individuellen Nutzerin bzw. des Nutzers zu lernen, welche Art von Inhalten und welche lokalen Spielerpersönlichkeiten, Bundesliga-Clubs, usw. von Interesse sind, und die entsprechenden Inhalte künftig schon im Vorgriff bereitzuhalten. Hinzu kommen Informationen wie das Land, in dem die Person tätig ist, und ihre Landessprache. Nutzerinnen und Nutzer können selbst weitere Informationen eingeben, die den Suchvorgang beschleunigen, sodass anhand aller dieser Vorgaben ein Nutzendenprofil und ein inhaltliches Ranking entsteht und automatisch der relevanteste Content gefunden wird. »Wenn eine Redakteurin oder ein Redakteur das System eine Weile genutzt hat, erscheinen bei jedem neuen Zugriff automatisch die neuesten Informationen zu den bevorzugten Spielern und Themen auf der Startseite, ausgewählt auf der Basis des persönlichen Profils und des bisherigen Suchverlaufs«, erläutert Deckenbrock.

Auf dem Weg zur Marktreife

Das Smart-Content-Projekt hat im Sommer 2025 die erste Proof-of-Concept-Phase mit der Vorstellung eines Prototypen abgeschlossen. Nun geht es darum, die Granularität der Mediensuche weiter zu erhöhen und das Produkt bis zur Marktreife weiterzuentwickeln. Insbesondere soll die Fähigkeit des Systems verbessert werden, inhaltlichen Kontext zu erkennen und Suchergebnisse nicht nur individuell, sondern auch kontextbezogen gruppiert bereitzustellen.

Autor: DFL

Bildrechte: DFL, Nonkonform

Anzeige

Most Popular

Anzeige

Newsletter

Keine Story mehr verpassen und
einfach den Newsletter abonnieren!

Anzeige

Anzeige

NABShow 2026

Die NABShow 2026 findet vom 18. bis 22. April in Las Vegas statt, die Ausstellungsflächen sind vom 19. bis 22. April geöffnet.
Las Vegas
19. bis 22. April

MPTS

MPTS 2026 – Wir feiern 10 Jahre Content Creation
London
13. bis 14. Mai

Anga Com 2026

Kongressmesse für Breitband, Medien & Konnektivität.
Köln
19. bis 21. Mai

Broadcast Asia 2026

Die BroadcastAsia 2026 findet vom 20. bis 22. Mai im Singapore EXPO statt.
Singapur
20. bis 22. Mai

CABSAT

CABSAT wurde 1993 gegründet und hat sich zu einer etablierten Veranstaltung für die Medien- und Kommunikationsbranche in der MEASA-Region (Naher Osten, Afrika, Südasien) entwickelt
Dubai
2. bis 4. Juni

IBC

Führende Veranstaltung für Content und Technologie in der Medienbranche.
Amsterdam
11. bis 14. September

Anzeige