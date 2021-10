Elements wollte nach der Einführung des BeeGFS-Dateisystems in der Medien- und Unterhaltungsbranche wissen und belegen, welche Fähigkeiten dieses Dateisystem in tatsächlichen Videoproduktions-Workflows hat. Wie das umgesetzt wurde, das zeigt dieser Artikel.

Dabei ging es Elements nicht nur darum, ob, sondern auch wie sich das BeeGFS-Dateisystem von ThinkparQ in den Bereichen Medien und Unterhaltung schlägt. In den Bereichen High Performance Computing, KI und Deep Learning sowie Wissenschaft hat sich BeeGFS schon bestens bewährt. Also führte Elements einen Benchmark-Test gemäß SPEC SFS VDA Storage Performance durch. Dabei wurden Höchstwerte erreicht, und im weiteren Verlauf dieses Artikels erklärt Elements, wie die hohe Punktzahl erreicht wurde. Darüber hinaus wird untersucht und verglichen, wie die Benchmark-Ergebnisse im Detail erreicht wurden und diskutiert, was diese Ergebnisse wirklich bedeuten.

Zusammenfassung

Ziel von Elements war es, die neue Dateisystemtechnologie BeeGFS seines Technologie-Partners ThinkparQ zu präsentieren, das zukünftige Potenzial von BeeGFS für die Medien- und Unterhaltungsindustrie herauszuarbeiten und das Ganze mit den etablierten Technologien in diesem Segment zu vergleichen.

Ein bekanntes Verfahren für solche Messungen ist der SPEC SFS Benchmark-Test, der maximalen Durchsatz und die erforderliche Reaktionszeit ermittelt und dadurch eine standardisierte Methode bietet, die den Vergleich unterschiedlicher Storage-Plattformen und Anbieter erlaubt.

Der Video Data Acquisition (VDA) Workload des SPEC SFS Benchmark wurde entwickelt, um den Ingest von einer Videoquelle zu simulieren, wobei die Anzahl der Videoströme mit jeweils etwa 36 Mbit/s gemessen wurde.

Der VDA-Workload wurde auf einer Elements-Bolt-basierten Speicherumgebung mit dem BeeGFS-Dateisystem ausgeführt. Die Testumgebung bestand aus einer vergleichbaren Menge an Hardware, wie sie auch im Einsatz war, als die bisher drei höchsten Testergebnisse ermittelt wurden. Elements entschied sich ganz bewusst für dieses Setup, um einen aussagekräftigeren und fairen Leistungsvergleich zu ermöglichen.

Die Zusammenfassung der Elements-Testergebnisse:

Höchste Stream-Anzahl (höchster Durchsatz) – 11.000 Streams (50708 MB/s). Dies entspricht einem um 14,58 % höheren Ergebnis als der bisherige Höchstwert.

(höchster Durchsatz) – 11.000 Streams (50708 MB/s). Dies entspricht einem um 14,58 % höheren Ergebnis als der bisherige Höchstwert. Die höchste Stream-Anzahl pro Speichergerät – durchschnittlich 76,39 Streams pro NVMe-Gerät.

– durchschnittlich 76,39 Streams pro NVMe-Gerät. Beste Gesamtlatenzkurve – die Latenz bleibt während des gesamten Testlaufs sowohl niedrig als auch stabil.

– die Latenz bleibt während des gesamten Testlaufs sowohl niedrig als auch stabil. Höchste Speicher-CPU-Effizienz – 23 % mehr gleichzeitige Streams pro CPU-Kern als der am höchsten bewertete Mitbewerber.

– 23 % mehr gleichzeitige Streams pro CPU-Kern als der am höchsten bewertete Mitbewerber. Höchste Client-CPU-Effizienz – 107 % mehr gleichzeitige Streams pro CPU-Kern als der am höchsten bewertete Mitbewerber.

– 107 % mehr gleichzeitige Streams pro CPU-Kern als der am höchsten bewertete Mitbewerber. Höchste RAM-Effizienz – 68 % mehr gleichzeitige Streams pro Gigabyte genutztem Arbeitsspeicher als der am höchsten bewertete Mitbewerber.

Die Benchmark-Ergebnisse wurden vom SPEC SFS-Komitee offiziell genehmigt und im September 2021 auf dessen Website veröffentlicht.

SPEC SFS-Leistungs-Benchmarking

Die Standards Performance Evaluation Corporation (SPEC) ist eine gemeinnützige Gesellschaft, die gegründet wurde, um standardisierte Benchmarks und Tools zur Bewertung der Leistung und Energieeffizienz der neuesten Generation von Computersystemen zu erstellen, zu pflegen und zu unterstützen. SPEC entwickelt Benchmark-Suiten und prüft und veröffentlicht die eingereichten Ergebnisse.

SPEC SFS Video Data Acquisition (VDA)-Benchmark ist ein etablierter Benchmark-Workload, der zur Leistungsbewertung verwendet wird, indem der maximale nachhaltige Durchsatz gemessen wird, den eine Speicherlösung liefern kann. Gleichzeitig wird auch die erforderliche Reaktionszeit verfolgt. Der Benchmark-Test läuft auf einer Gruppe von Workstations, die auch als Clients bezeichnet werden, und misst die Leistung der Speicherlösung, die Dateien fürs Application Layer der Clients bereitstellt. Im VDA-Benchmark simuliert diese Arbeitslast letztlich eine Anwendung, vergleichbar mit dem Daten-Ingest von einer externen Quelle. Daher lässt sich der Benchmark am besten als ein Leistungstest für den Ingest-Workflow beschreiben. Der gängige Wert hierfür ist die Anzahl der Videostreams, wobei jeder Stream einer Bitrate von etwa 36 Mbit/s entspricht.

BeeGFS kennenlernen

BeeGFS ist ein paralleles Dateisystem, das aus einem Forschungsprojekt des deutschen Fraunhofer-Zentrums für Hochleistungs-Computing hervorging und zur Unterstützung leistungsorientierter Anwendungsfälle wie HPC, KI und Deep Learning entwickelt wurde.

Es hat eine zentrale Rolle bei beeindruckenden Projekten wie der ersten Visualisierung eines Schwarzen Lochs im April 2019 gespielt und ist mittlerweile ein wichtiger Bestandteil der Workflows von NASA, Shell und des Max-Planck-Instituts. Es ist auch das Dateisystem der Wahl für eine Reihe von Top500-Supercomputern. Dieses innovative Dateisystem erreicht eine hohe Leistung, indem es die Benutzerdaten transparent über mehrere Speicherknoten verteilt. Außerdem kann es die Metadaten des Dateisystems auf mehrere Metadatenserver verteilen.

Mit anderen Worten: BeeGFS wurde speziell für den gleichzeitigen Zugriff und für Cluster-Anwendungen entwickelt und bietet eine hohe Robustheit und Leistung in Situationen mit hoher I/O-Last oder Patterns. Seine flexible Architektur ermöglicht eine »On the Fly«-Skalierung von Kapazität und Leistung von kleinen Clustern bis hin zu Systemen der Enterprise-Klasse mit Tausenden von Knoten.

BeeGFS ist von Grund auf für Ethernet konzipiert und bietet mit der nativen RDMA-Unterstützung und einem nativen Linux-Client höchste Leistung. Verschiedene andere nützliche Funktionen wie Speicherkontingente und die Spiegelung von Benutzerdaten/Metadaten werden ebenfalls angeboten. Eine Eigenschaft von BeeGFS, die Elements für besonders nützlich hält, ist, dass es hybride Speicherumgebungen einfacher als andere Lösungen unterstützen kann. Damit ist es möglich, leistungsfähige und dennoch effiziente Umgebungen aufzubauen, verschiedene Speichermedien zu kombinieren und zukunftssichere Hybrid-Cloud-Lösungen zu erstellen.

BeeGFS und die Cloud

Ein weiterer Bereich, in dem BeeGFS glänzen kann, sind Cloud-Workflows. Dieses Dateisystem ermöglicht nicht nur eine einfache Integration von Cloud-Instanzen wie AWS und Microsoft Azure in eine hybride Speicherumgebung, sondern bietet auch eine großartige Innovation.

BeeOND ist ein On-Demand Deployment BeeGFS, das es erlaubt, mit einem einzigen Befehl ein Dateisystem auf einer beliebigen Anzahl von Rechnern aufzusetzen. Solche BeeOND-Instanzen bieten einen sehr schnellen und einfach zu nutzenden Zwischenspeicher, während sie gleichzeitig die I/O-Last vom primären Speicher-Cluster fernhalten. Mit anderen Worten, es wird bald möglich sein, die Kapazität und Leistung des Dateisystems flexibel zu erweitern und alle Vorteile von Cloud Storage zu nutzen. Sobald der Bedarf gedeckt ist, können die BeeOND-Dateisysteminstanzen ebenso schnell wieder entfernt werden – eine echte, effiziente Cloud-On-Demand-Lösung.

Die Leistung von BeeOND wurde sogar vom Azure HPC Team getestet und demonstrierte das erste cloudbasierte parallele Dateisystem mit einem Terabyte pro Sekunde. Ganz konkret erreichte das System 1,46 TB/s Leseleistung und 456 GB/s Schreibleistung.

