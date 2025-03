Aiconix beschreibt DeepVA als. »Darunter verstehen wir, dass wir mit unserer Plattform verschiedenste KI-Services miteinander auf einer Plattform verbinden können«, erläutert Johann Rückel, Chief Partner Officer bei Aiconix. »Für unsere Kunden liegt der größte Vorteil in der Flexibilität und der Effizienz bei der Analyse und Verarbeitung mulitmedialer Inhalte. Durch die Integration verschiedener KI-Dienste, stellen wir sicher, dass Unternehmen die Tools erhalten, die sie benötigen, um individuelle, skalierbare Lösungen für ihre spezifischen Anforderungen zu entwickeln. Immer mit dem Fokus auf absolute Genauigkeit, Datensicherheit und nach den Richtlinien des EU AI Acts.«

Die Vorgehensweise ist dabei recht einfach: »Das System wird mit Daten gefüttert, diese werden vorverarbeitet, antrainiert und dann für die Analyse und Automatisierung von Aufgaben genutzt. »Mit einfachsten Bordmitteln, oder mit ‘Zero Code‘, wie man heutzutage sagt, kann man mit Aiconix eigene Modelle trainieren. Etwa für Gesichtserkennung, für Übersetzungen und vieles mehr«, erläutert Rückel. Er betont: »Wir hatten immer den Ansatz, dass Personen ohne Coding-Erfahrung KI- Funktionalitäten einsetzen und in ihre Geschäftsprozesse einbinden können.«

»Das System hilft schon beim Antrainieren der Daten, durch Feedback zur Qualität der Trainingsdaten, möglichst gute Ergebnisse zu erzielen«, erklärt Esther Arroyo Garcia, Mitgründerin der Plattform DeepVA. »Schon beim Hochladen der Daten evaluiert das System unscharfe, doppelte oder fehlerhafte Dateien und warnt dementsprechend.«

Die gefragtesten Aiconix KI-Module

»Derzeit sind Face Recognition und das Erstellen von Transkripten am gefragtesten bei DeepVA«, erläutert Johann Rückel. Transkripte von Meetingsituationen lassen sich editieren sowie automatisierte Zusammenfassungen oder Protokolle daraus erstellen. Mit der Ergänzung durch Large Language Models (LLMs) und Visual Language Models (VLMs) können innerhalb der Zusammenfassungen weitere Optimierungen gemacht werden, beispielsweise die Transformation in einfache Sprache.

Mit der Live-Transkription und Untertitelung arbeitet Aiconix mit großen Broadcastern und Publishern zusammen, die ihre Beiträge rund um die Uhr untertiteln. Das Besondere hierbei ist die Möglichkeit, mit dem sogenannten Live-Editor direkt in Live-Transkripte eingreifen zu können, bevor diese gesendet werden.

Anwendungsfälle

Die Kunden von Aiconix setzen DeepVA für unterschiedlichste Aufgaben ein:

Die Deutsche Welle etwa realisierte damit eine automatisierte Diversitäts-Analyse ihres Contents. Auf der Basis ihrer Analyse generiert die KI dabei aufwändige und detaillierte Reports. Händisch wäre das nur mit hohem Aufwand möglich.

Transkription ist derzeit eine der großen Anforderungen in der Branche. Axel Springer und die Welt nutzen DeepVA genau dafür und erstellt mit der Plattform in Echtzeit ihre Untertitel 24/7. Die Lösung, basierend auf dem Deep Live Hub der Aiconix, ermöglicht einen reibungslosen Workflow, der den gesamten Übertragungsprozess unterstützt. Im Gegensatz zur traditionellen, manuellen Untertitelung, die bei Live-Sendungen teuer und aufwändig ist, bietet Aiconix eine flexible und kosteneffiziente Alternative.

Auch bei der Bundespressekonferenz ist DeepVA für den Live Feed der Untertitel verantwortlich. Wichtig hier war ein manuelles Eingreifen in Untertitel über den Live-Editor, bevor diese gesendet werden um absolute Korrektheit zu gewährleisten.

Mit der Firma Zebra Live der Bose Park Productions, testete die Aiconix im Zuge des European Publishing Congress die Live-Transkription und Übersetzung für ein Live Event. Um die internationale Konferenz zugänglicher zu machen, sollte sie in fünf Sprachen übersetzt werden. Die Audiosignale der Bühne wurden so mittels Aiconix live transkribiert und übersetzt. Diese Übersetzungen wurden dann mittels Text to Speech wieder in Synthetisierte Sprache umgewandelt und über Kopfhörer übertragen.

DeepVA nutzt nicht nur eigene KI-Modelle, sondern auch externe KI-Service um ihren Kunden eine bestmögliche Lösung anzubieten. Ein Beispiel dafür ist Audio Enhancement der Berliner Firma ai|coustics, die in der Lage sind Atmo Geräusche im Hintergrund auszublenden, so dass Sprecher klar zu hören sind (Klare Sprache, verständliche Sprache).

Zusammen mit dem Bayerischen Rundfunk werden in der Bild-und Videoanalyse nicht nur die Gesichter erkannt, sondern gleichermaßen die Bauchbinden. »Dabei wird das Gesicht und der Name innerhalb der Bauchbinde gematcht und so automatisiert ein Personen-Datensatz für bayerische Persönlichkeiten erstellt. Natürlich ist dies rechtlich geklärt und strengstens mit dem Datenschutz abgestimmt. Nur der Kunde hat Zugriff auf diese Daten«, erläutert Esther Arroyo Garcia.

Weitere Anwendungsfälle sind zum Beispiel KI gestütztes Ad-Placement, wobei in Filmen gesprochene oder gezeigte »Konzepte (Keywords)« ermittelt und passende Werbung anhand der IAB-Content Taxonomy dazu ausgespielt werden können.

Das Stadtarchiv Heilbronn konnte die Verschlagwortung von Fotomaterialsautomatisieren und große Datenmengen mit Meta-Informationen anreichern. Das Ziel war es, bei gleichem Personalaufwand mehr Fotos zu erschließen, diese für die Bevölkerung recherchierbar zu machen und in die bereits vorhandene IT-Infrastruktur des Stadtarchivs Heilbronn zu implementieren.

