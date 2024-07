Welche Möglichkeiten die assistierende KI Avid Ada bietet und welche Chancen und Risiken KI birgt, erläutert Shailendra Mathur von Avid.

Shailendra Mathur ist Vice President of Architecture and Technology bei Avid. Beim Event »Avid Frame the Future« setzte er sich in seinem Vortrag mit dem Thema KI auseinander.

Er zeigt, wie die KI-gesteuerten Tools von Avid Ada nicht nur die Zusammenarbeit optimieren, sondern auch die Qualität und Vielfalt der Inhalte verbessern können. Dabei fungiert Avid Ada als kreativer Co-Pilot. Mathur geht zudem auf die vielfältigen Einsatzmöglichkeiten von maschinellem Lernen und generativer KI ein.

Doch neben den Chancen beleuchtet Mathur auch die Herausforderungen und Gefahren, die mit dem Einsatz von KI einhergehen. Wie wirkt sich die Automatisierung auf den Berufseinstieg neuer Talente aus? Und welche ethischen Überlegungen müssen wir anstellen, um die kreative Integrität zu bewahren?

»Avid Frame the Future« – virtuelles Event in voller Länge.

Shailendra Mathur über KI

»Bei KI geht es darum, Zeit zu sparen und kreativer zu werden. Sie kann Ihnen all jene alltäglichen Aufgaben abnehmen, die Sie aufhalten, und Sie kann Ihnen Zeit für Kreativität verschaffen.

In einer Welt, in der Sie ein Team, das an verschiedenen Orten und zu verschiedenen Zeiten arbeitet, miteinander verbinden müssen, kann KI auch die Zusammenarbeit optimieren.

Sie können nun in einem schnelleren Tempo arbeiten, aber die Qualität des Geschichtenerzählens wird dennoch besser. Die Inhalte können dank KI nämlich für ein diverses Publikum entwickelt werden, insbesondere für ein geografisch vielfältiges Publikum, d. h. Sie können mehr Regionen und potenzielle Kanäle erreichen und gleichzeitig den Zugang personalisieren, um die Monetarisierung Ihrer Inhalte zu erhöhen und zu verbessern.

Bei der Nutzung dieser Chancen müssen wir aber auch die Gefahren bedenken. Wir haben bereits einen Mangel an qualifizierten Mitarbeitern, die in unsere Branche kommen. Einige der banalen Aufgaben, die jetzt von der KI übernommen werden, würden neuen Talenten normalerweise bei der Einarbeitung übertragen. Verringern wir durch die Abschaffung von operativen Aufgaben der Einstiegsebene den Pool an Redakteuren der nächsten Generation? Setzen wir durch die beschleunigte Bereitstellung von Inhalten die Kreativen unter unrealistischen Druck und werten ihren Beitrag letztlich ab?

Durch KI könnte der kreative Funke, der von einzelnen Personen ausgeht, reduziert und durch uninspirierte, vorgefertigte Inhalte ersetzt werden. Außerdem gibt es Probleme mit der Zuordnung und dem Plagiat. Ich möchte kein Schreckensbild malen, aber wir alle müssen diese Gefahren ebenso berücksichtigen wie die Vorteile.

Bei Avid konzentrieren wir uns auf die verantwortungsvolle KI, auf die sich die gesamte Branche zubewegt. Es gibt EU-Verordnungen und Kongresssitzungen in den USA, die nicht dazu gedacht sind, die Menschen in ihrem Handeln einzuschränken, sondern die notwendig sind, um den Einsatz von KI in irgendeiner Form zu regulieren.

KI sollte nicht der Pilot Ihres Flugzeugs sein; sie ist Ihr Co-Pilot – und Sie fliegen das Flugzeug selbst. Auch wenn man also die Wahl hat, etwas vollständig Automatisiertes zu entwickeln, sollte die Entscheidung so getroffen werden, dass der Mensch in der Schleife bleibt.

Theoretisch sollte die Automatisierung keine menschliche Aufsicht erfordern. Das wäre der Fall, wenn sie auf Algorithmen basiert, die als Code implementiert sind – wir wissen genau, was vor sich geht, weil Code deterministisch ist. Deep Learning und generative KI-Modelle sind jedoch nicht erklärbar und nicht deterministisch. Daher ist eine gezielte Kontrolle über die Entscheidungen erforderlich, die mit Hilfe dieser Modelle getroffen werden.

Was ist ML und was ist generative KI?

Alles, was automatisch abläuft und ein gewisses Maß an intelligenter Entscheidungsfindung beinhaltet, ist künstliche Intelligenz (KI) .

. Durch maschinelles Lernen (ML) werden Muster für eine tiefere Analyse, ein besseres Verständnis und eine bessere Ausführung gelernt.

werden Muster für eine tiefere Analyse, ein besseres Verständnis und eine bessere Ausführung gelernt. Generative KI ist eine ganz bestimmte Art von ML.

Bei der Erstellung von Skripten, Storyboards, Musik, Notation, Video oder Sprache wird generative KI eingesetzt. Sie nimmt Eingaben wie Text, Audio, Video usw. entgegen und erstellt auf der Grundlage von Mustern, die sie in den Eingabeinhalten erkennt, neue Inhalte.

Von allen Inhalten, die mit generativer KI generiert werden können, haben wir bei Avid schnell erkannt, dass Sprache-zu-Text der wichtigste Bereich für uns ist. Abgesehen von offensichtlichen Anwendungsfällen wie der automatischen Erstellung von Transkripten, Untertiteln und Übersetzungen können wir, wenn der Text mit einem Timecode verknüpft ist, Timing-Entscheidungen auf der Grundlage von Dialogen treffen, um eine Sequenzierung durchzuführen.

In gewisser Weise bietet der in Text umgewandelte Dialog die besten Metadaten, die für die Suche nach Inhalten verwendet werden können. Mit dem Aufkommen umfangreicher Sprachmodelle kann das Sprache-zu-Text-Material für die Suche auf der Grundlage der Bedeutung des Inhalts und nicht nur der Syntax verwendet werden, um Erkenntnisse zu gewinnen, Zusammenfassungen zu erstellen usw. Dies alles sind Funktionen, die zu Zeit- und Kosteneinsparungen bei der Recherche, der Datenaufbereitung und der kreativen Entscheidungsfindung beitragen.

Da wir nun dazu übergehen, mit der Semantik des Inhalts zu arbeiten, benötigen wir ein grundlegendes Verständnis von Wissensmanagement, das die Metadatensuche auf einen neuen Bereich ausdehnt, in dem man nicht nur Informationen und Syntax sucht, sondern Erkenntnisse und Wissen über den Inhalt gewinnt. Die Suchbereiche werden sich auf Abfragen in einer beliebigen natürlichen Sprache verlagern, die umfassendere kontextbezogene Ergebnisse liefern als eine einfache Übereinstimmung mit einem Schlüsselwort. Wenn Sie beispielsweise nach einem Kommentar von Christopher Nolan zum Film »Oppenheimer« fragen, wird er gefunden, auch wenn keine Metadaten gespeichert sind, die diese Assoziation ermöglichen. Es assoziiert das Video mit dem Text von Sprache-zu-Text, da beide eine ähnliche semantische Einbettung aufweisen. Da wir jetzt mit der Bedeutung von Text arbeiten, können wir Variationen einer Geschichte nehmen und das passende Video finden, das B-Roll-Material zu dieser Geschichte liefert.

Die KI-Technologie entwickelt sich rasant, und Avid bietet Prototypen und technische Vorschauen an, um Feedback zu potenziellen neuen KI-gesteuerten Funktionen und Lösungen einzuholen. Ihr Input hilft uns dabei, uns auf das zu konzentrieren, was den größten Kundennutzen bietet, sei es bei Kreativ-, Kollaborations-, Content-Management- oder Automatisierungs-Tools.

Avid Ada

Avid Ada ist unser künstlerischer digitaler Assistent, der KI nutzt, um den kreativen Prozess innerhalb der Avid-Lösungen zu unterstützen. Es gibt verschiedene Formen, aber in Prototypen hat Avid gezeigt, dass es als kreativer Assistent oder Co-Pilot funktioniert.

Wenn Sie eine Geschichte schreiben oder bearbeiten, kann Avid Ada Inhalte empfehlen. In Sibelius, unserer Musikkompositionssoftware, kann Avid Ada helfen, indem es auf der Grundlage einer Harmonieanalyse neue Noten und Akkorde vorschlägt.

Wir haben auch Prototypen vorgeführt, die zeigen, wie Avid Ada bei der kontextbezogenen Fehlerbehebung hilft, und zwar über den Avid Ada Chatbot, bei dem die Benutzer sich mit dem Produkt unterhalten, um hilfreiche Tipps und Anleitungen zu erhalten. Und das nicht nur auf Englisch, sondern in vielen Sprachen.

Der Avid Ada-Chatbot wird in MediaCentral | Cloud UX, Media Composer und Pro Tools vorgeführt. Wenn Sie in MediaCentral fragen: »Hey, wie mache ich einen Ingest?«, weiß der Chatbot, dass Sie nach MediaCentral fragen und nicht etwa nach einem Ingest in Media Composer oder Pro Tools.

Eine der unterstützenden Methoden von Avid Ada ist die Generierung von API-Code. Ein Benutzer möchte sich normalerweise nicht mit APIs befassen, da er kein Programmierer ist. Wir erforschen eine leistungsstarke Methode zur Verwendung von Avid Ada in Pro Tools und Media Composer, bei der Avid Ada Ihnen nicht nur sagt, wie Sie die Benutzeroberfläche umgehen müssen, um eine Funktion auszuführen, sondern diese auch für Sie ausführt. In Pro Tools können Sie Avid Ada zum Beispiel fragen, wie Sie eine Session in der Benutzeroberfläche erstellen können, aber auch einfach darum bitten, sie für Sie zu erstellen.

In Media Composer bieten wir auf der Grundlage von Sprache zu Text PhraseFind AI und ScriptSync AI an, die zum Auffinden von Inhalten und zur Synchronisierung von Skripten mit Videos auf der Grundlage mehrsprachiger Dialoge verwendet werden. Wir haben auch Prototypen gezeigt, mit denen Sie Avid Ada bitten können, lustige Clips zu finden, als Beispiel. Was lustig ist, ist natürlich auch bei KI subjektiv, aber es ist eine Methode, um Inhalte zu finden.

Sobald man ihn gefunden hat, kann man daraus einen Sub-Clip generieren und alle Sub-Clips automatisch zu einem Schnitt zusammenfügen. Dies nennen wir »Conversational Editing«. Dabei sprechen Sie mit der Anwendung, um einen Schnitt zu erstellen.

Die Fortschritte im Bereich der künstlichen Intelligenz haben einen gesellschaftlichen Umbruch bewirkt, und unsere Branche befindet sich genau in dessen Zentrum. Unternehmen haben nun eine kosteneffizientere Möglichkeit zur Bereitstellung von Inhalten. Das birgt aber auch die Gefahr, dass die Geschichten in Zukunft veraltet und uninspiriert sind. Dieses Risiko wird in der Branche so ernst genommen, dass es zu zwei Streiks geführt hat, die die Rechte der Kreativen schützen sollen.

Es gibt ebenso viele zukünftige Herausforderungen wie Versprechen, aber trotz des Risikos wird die KI nicht verschwinden. Wir müssen gemeinsam dafür sorgen, dass höhere Formen der Kreativität nicht verloren gehen. Für uns muss der Einsatz von KI verantwortungsvoll und ethisch vertretbar sein und Medienschaffende dazu befähigen, die Welt zu unterhalten und zu erleuchten.«

