Broadcast, Top-Story: 04.01.2006

Wege zur digitalen Archivierung

Welche Möglichkeiten gibt es für Rundfunksender, ein Archiv aufzubauen, das einen langfristigen Zugriff erlaubt, aber dennoch vergleichsweise kostengünstig ist? Ulf Genzel von BIC4 zeigt Lösungsansätze auf. (PDF-Download am Ende des Textes).

Moderne Archivsysteme sind für Broadcaster wie auch für Produktionshäuser zu wichtigen Werkzeugen geworden, um Hörfunk- und Fernsehbeiträge nachhaltig zu sichern und zu verwalten.

Allerdings lagern in den Kellern der Rundfunkhäuser nach wie vor große Teile des Archivs auf analogen, vielfach auch veralteten Magnetbändern. Nach etwa 15 Jahren erreichen diese Magnetbänder einen kritischen Zustand: Oft ist dann nicht mehr sicher, dass die Bänder auch langfristig noch genutzt werden können. Je mehr Zeit vergeht, desto größer ist die Gefahr, dass wichtiges und wertvolles Material unwiderbringlich zerstört wird. Öffentlich-rechtliche Fernsehsender haben im Rahmen ihres Programmauftrages jedoch eine fest verankerte Pflicht, ihren Zuschauern und -hörern das gesellschaftliche Kulturgut zu vermitteln und ihr Programmarchiv für künftige Generationen zu bewahren. Aus diesem Grunde ist eine moderne — vorzugsweise digitale — Archivierung von Bild- und Tonträgern gerade für die öffentlich-rechtlichen Rundfunkanstalten besonders wichtig.

Die Vorzüge der digitalen Archivierung gegenüber der analogen Speicherung von Bild- und Tonmaterial liegen auf der Hand: Nahezu jeder dürfte bei der täglichen Arbeit das einfache Kopieren, Sichern oder Vervielfältigen digitaler Informationen sehr zu schätzen gelernt haben. Die wesentlichen Anforderungen an eine effektive digitale Archivierung sind jedoch vielschichtig:

• Idealerweise sollte der zu archivierende Content in einer Form vorliegen, in der ein langfristiger Zugriff auf den Original-Inhalt in guter Qualität jederzeit möglich ist – ohne dass hierbei das Material verändert werden muss.

• Ein digitales Archiv-System sollte ein möglichst hohes Maß an Interoperabilität aufweisen. Im Klartext: Im digitalen Zeitalter ändern sich Technologien ständig, deshalb sollte ein digitales Archiv in einem Format angelegt werden, das nach allen Seiten möglichst offen ist.

In der Praxis richten sich Art und Umfang einer langfristigen Speicherung von Hörfunk- und Fernsehbeiträgen danach, wie lange das Archiv »leben« und natürlich auch daran, wie effektiv sich das Audio- und Video-Material nutzen lassen soll. Die Vorteile, die ein Sender hat, wenn er Material unterschiedlichster Quellen zentral speichert und unternehmensweit verwaltet, haben die meisten Sender erkannt. Doch die Investition in die hierfür notwendige Technik ist nach wie vor ein großer Hemmschuh – und doch spielt sie die entscheidende Rolle, wenn ein Sender langfristig wettbewerbsfähig bleiben möchte.

Generell gibt es aber trotz solcher Hindernisse einen eindeutigen Trend bei den Sendern hin zur file-basierten Speicherung und Bearbeitung von Audio- und Video-Content. Die klassischen Speichermethoden werden nach und nach abgelöst. Vorreiter war dabei der Hörfunk, was in der Natur der Sache liegt: Die digitale Hörfunk-Produktion benötigt nur etwa 1 % der Speichermenge im Vergleich zur digitalen Fernsehproduktion. So ist es leicht nachvollziehbar, dass bei den Radiostationen die Digitalisierung und filebasierte Produktion nahezu vollständig abgeschlossen ist.

Im Fernsehbereich sind die Broadcaster mit dieser Entwicklung noch nicht soweit, was bei der vielfachen Datenmenge ebenso leicht nachvollziehbar ist. Doch auch in diesem Bereich geht es vorwärts: Hier haben sich zwischenzeitlich zwei gängige File-Formate herauskristallisiert: IMX und DV. Beide File-Formate (*.imx und *.dif) lassen sich für die digitale Archivierung sehr gut verwenden – unter anderem deshalb, weil sie in Verbindung mit einem Wrapper-Format wie MXF auch zusätzliche Infos, also Metadaten, speichern können. Auch für den nativen Austausch von Content sind die Formate gut geeignet. Beim Austausch und auch bei der Speicherung möchte man natürlich Qualitätsverluste und aufwendige Kodier- und Dekodier-Prozesse innerhalb eines Broadcast-Workflows vermeiden. Die File-Formate IMX und DV werden daher im professionellen Einsatz für gewöhnlich mit einer Datenrate von 50 Megabit pro Sekunde (Mbps) für das Videosignal verwendet. Brutto ergibt sich dann für das gesamte TV-Signal mit Ton ein Speicherplatzbedarf von 7,5 MB (Megabyte) pro Sekunde. Pro Stunde müssen also für die native Archivierung bereits 27 GB (Gigabyte) Speicherplatz bereitgestellt werden. Bei TV-Sendern erfodert ein file-basiertes digitales Archiv also sehr schnell eine immense Speicherkapazität.

Speicherung: Band oder Disk?

Bei den Investitionentscheidungen für eine moderne digitale Archivierung spielen wirtschaftliche Argumente eine gewichtige Rolle. Ein einfacher Kostenvergleich zeigt, dass die Speicherung auf ein Bandmedium im Gegensatz zur Speicherung auf eine Festplatte deutlich günstiger ist: Kostet etwa die Speicherung auf einer professionellen SATA-Disk (Serial Advanced Technology Attachment) 1,50 Euro pro GB, liegt der Preis für die gleiche Datenmenge bei Speicherband vom Typ LTO-3 (Linear Tape Open) bei 0,30 Euro. Der Kostenvorteil von Band als Speichermedium ist also deutlich. Weiterer Vorteil: Die Migration hin zu neuen, schnelleren und größeren Bandmedien ist immer ein leicht gangbarer Weg. Besonders dort, wo es um Langzeitspeicherung geht und kein unmittelbarer, sekundenschneller Zugriff nötig ist, ist Band als Speichermedium im Vorteil.

In existierenden digitalen Archiv-Lösungen wird für gewöhnlich eine Kombination aus Tape-Technologie und Disk-Storage eingesetzt. Firmen wie Adic, HP, IBM, StorageTek oder Spectralogic bieten seit vielen Jahren schon im IT-Umfeld erfolgreich ihre Datenband-Roboter in verschiedenen Ausführungen und Dimensionen an. So werden im neuen Fernseharchiv des Bayerischen Rundfunks (BR) in München-Freimann zwei redundante Roboter von StorageTek vom Typ 9310 (»Powderhorn«) eingesetzt. Mit den jeweils bis zu 6.000 Medien, die ein solcher Roboter verwalten kann, bietet diese Library bis zu 1.200 Terabyte (TB), also 1,2 Petabyte (PB) Speicherkapazität. Diese Rechnung basiert auf der Verwendung von Speichermedien zu aktuell je 200 GB pro Datenband. In einem anderen Archiv-Projekt im neuen Sendezentrum von RTL II in München-Grünwald wird ein PetaSite-System von Sony eingesetzt. Dieser Roboter kann in einer mittleren Ausbaustufe bis zu 1.000 Medien mit je 500 GB Kapazität aufnehmen. Als Speichermedium wird hier S-AIT (Advanced Intelligent Tape) verwendet. So ergibt sich eine Gesamtkapazität von 0,5 Petabyte. Die PetaSite-Library kann bei Bedarf modular erweitert werden, um die Kapazität an den tatsächlichen Bedarf des Senders anzupassen.

Betrachtet man die benötigte Speicherkapazität eines TV-Senders über einen längeren Zeitraum anhand konkreter Zahlen und Erfahrungswerte, ergibt sich eine sehr interessante Rechnung (siehe Tabelle).

In einem Jahr Betriebsdauer liegt das Volumen des zu archivierenden Materials im Beispiel des betrachteten TV-Senders bei 8.500 Stunden pro Jahr. Bei der Verwendung des oben bereits erwähnten File-Formates IMX ergibt das einen Speicherplatz-Bedarf von 229.500 GB im ersten Jahr. Ab dem 3. Jahr erhöht sich im zitierten Projektbeispiel das jährliche Archiv-Volumen auf 10.200 Stunden, da ab diesem Zeitpunkt zusätzlich Altmaterial archiviert werden soll. So summiert sich der Bedarf an Speicherplatz in 10 Jahren auf die beeindruckende Zahl von 2.662.200 GB, was 2,6 Petabyte entspricht.

Bei gleich bleibender Kapazität der Speicherbänder von derzeit 200 GB würde sich in 10 Jahren ein Bedarf von über 13.000 Medien ergeben. Beim Blick auf die Tabelle ist jedoch schnell festzustellen, dass die Kapazität eines großen Roboters mit etwa 6.000 Bändern nicht überschritten werden muss. In den vergangenen Jahren war nämlich zu beobachten, dass sich die Kapazität von Speichermedien alle zwei bis drei Jahre verdoppelt hat. Selbst bei vorsichtiger Betrachtung ist davon auszugehen, dass in wenigen Jahren Medien einsetzbar sind, die eine Kapazität von deutlich mehr als einem Terabyte bieten werden.

Verwaltung digitaler Archive

Will man ein digitales Archiv effektiv verwalten, benötigt man eine geeignete Verwaltungs-Software – nicht zuletzt deshalb, weil innerhalb des Archivs oftmals die Migration auf neue und leistungsfähigere Medien ansteht. Marktführer in diesem Bereich ist das französisch/US-amerikanische Unternehmen Front Porch Digital, das in diesem Segment rund 84 % des Marktes bei Rundfunkanstalten abdeckt.

Die Software DivArchive ist eine speziell für datenintensiven Content entwickelte Archiv-Middleware. DivArchive steht für Digital Integrated Versatile Archive. Div-Archive integriert die gesamte Ressourcen-Verteilung und Verwaltung innerhalb eines Archiv-Systems und ist in der Lage, Anfragen von anderen System zu übernehmen und entsprechende Aktionen auszulösen.

So kann etwa der Befehl »Bitte archivieren« den Transfer des Materials von einem Video-Server in den Online-Bereich des Archivs oder auch gleich die langfristige Speicherung des Materials auf Band auslösen. Bei solchen Vorgängen ist eine große Zahl von Steuerungsbefehlen abzuarbeiten, ebenso müssen Datenbank-Einträge vorgenommen werden. Zudem muss ein Archivierungssystem auch möglichst viele Schnittstellen zu anderen Systemen bieten, denn erfahrungsgemäß arbeiten TV-Sender oft mit ganz unterschiedliche Workflows und haben daher unterschiedliche Anforderungen an ein Media Asset-Management-System.

Eine Besonderheit des Div-Archive-Systems ist das teilweise Auslesen von sehr großen Datenfiles aus einem digitalen Archivbestand. Beispiel hierfür: Ein 90-minütiges Fußballspiel, das eine Speicherkapazität von etwa 40 GB einnimmt, muss bei DivArchive nicht vollständig aus dem Archiv ausgelesen werden, nur um eine einzelne Torszene herausschneiden zu können. Diese Funktionalität wird »Partial Restore« genannt und ist zum Erreichen von möglichst kurzen Zugriffszeiten eine essenzielle Eigenschaft für ein wirklich brauchbares Archiv-Konzept in einem Fernsehsender.

Digitales Archiv als Gesamtlösung

Betrachtet man ein digitales Archiv als Gesamtlösung, ist die Idealvorstellung für die Integration ein »Zwiebel-Modell«, in dessen Kern sich ein System wie DivArchive für das Speicher-Management befindet. »Außen« befindet sich die Anwendungsschicht eines Media-Asset-Management-Systems, das die Dokumentation, Indexierung und Recherche der eigentlichen Programminhalte enthält – und natürlich die gewünschten Kernprozesse des Anwenders abbildet.

Downloads zum Artikel:

T_1205_BIC4_DigiArchiv.pdf