HeyGen: Ein Video in 175 Sprachen
Diese Folge zeigt, wie HeyGen aus einem einzigen Video mit KI-Übersetzung, Stimmenklonung und Lippensynchronisation ein globales Asset macht. Außerdem geht es um das rasante Wachstum des Unternehmens, den B2B-Einsatz und die Grenzen zwischen Effizienz, Vertrauen und kultureller Nuance.
Chapter 1
Ein Video, vier Märkte, null Zusatzshooting
Max Quantum
Stell dir mal folgendes Szenario vor: Ein Münchner Fitness-Coach nimmt am Montagmorgen in seinem Studio ein einfaches, 90-sekündiges Video auf. Das Thema: „So baust du in acht Wochen mehr Kraft auf.“ Er spricht ganz normal auf Deutsch. Am Dienstag läuft genau dieses Video im Netz -- allerdings auf Englisch, Spanisch, Portugiesisch und Japanisch. Und zwar nicht mit Untertiteln, sondern mit synchronen Lippenbewegungen und einer Stimme, die exakt wie seine eigene klingt, nur dass sie eben fließend Japanisch spricht. [pauses]
Eva Cortex
Okay, warte mal -- [chuckles] das klingt im ersten Moment fast ein bisschen unheimlich. Aber wenn ich das richtig verstehe, hat der Coach dafür kein einziges Mal neu vor der Kamera stehen müssen? Kein zweites Shooting, keine Übersetzungsagentur, gar nichts?
Max Quantum
Genau. Null Zusatzshooting. Und genau da wird klar, warum die Plattform HeyGen gerade so extrem schnell relevant geworden ist. Der eigentliche Hebel liegt hier nämlich nicht darin, dass Video als Medium neu erfunden wird. Es geht darum, dass die komplette zweite, dritte und vierte Produktion einfach wegfällt. HeyGen macht aus einem einzigen Video ein globales Asset. Aufnahme, Stimmen-Klonung, Übersetzung und Lippensynchronisation passieren in Minuten statt in Wochen.
Eva Cortex
Heißt für mich: Es geht hier eigentlich gar nicht um eine „schicke Übersetzung“ als nettes Feature, sondern um einen völlig neuen Workflow. [thoughtfully] Wenn man aus einem einzigen Content-Stück theoretisch 175 verschiedene Sprachversionen auf Knopfdruck bauen kann, verschiebt sich die ganze Logik. Aber wer nutzt das denn jetzt wirklich als Erstes? Ist das der klassische Creator, oder reden wir hier über B2B?
Max Quantum
Es verschiebt sich vor allem im B2B-Bereich massiv. Sprache war im digitalen Business ja lange die letzte echte Distributionsbarriere. Websites übersetzen oder Untertitel drunterklatschen -- das ging schon immer irgendwie. Aber sobald eine echte Person im Video zu sehen war, wirkte das in einer anderen Sprache sofort fremd, fast schon distanziert. HeyGen greift genau diese Hürde an. Das deutsche SaaS-Team, das sein Onboarding für den US-Markt lokalisieren will, nutzt das genauso wie der Sales-Operator, der einem Lead in Tokio eine scheinbar persönliche Videobotschaft schickt.
Eva Cortex
Das ist ja genau der Punkt, der mich immer wieder überrascht: die Skalierung von persönlicher Ansprache. [skeptical] Wenn der japanische Lead merkt, dass der deutsche Vertriebler in Wirklichkeit kein Wort Japanisch spricht, sondern ein KI-Klon vor ihm flimmert -- bricht da nicht sofort das Vertrauen weg? Oder ist das Ergebnis mittlerweile so gut, dass man es schlicht nicht mehr sieht?
Max Quantum
Der Punkt ist ein anderer: Es geht oft gar nicht darum, den perfekten Deepfake vorzutäuschen, sondern die Reibung beim Verstehen komplett zu nehmen. Wenn die Lippenbewegung exakt zum Ton passt, schaust du das Video einfach entspannter. Das Gehirn muss nicht ständig diesen Widerspruch zwischen Tonspur und Bild verarbeiten. Der Nutzen ist sofort da, und die Nutzerakzeptanz steigt genau deshalb so rasant. [reflective]
Chapter 2
Warum das Modell gerade jetzt skaliert
Eva Cortex
Okay, wenn das so reibungslos funktioniert, müssen die Zahlen dahinter ja ziemlich massiv sein. [curious] Wie sieht denn das Business-Modell aus? Ist das wieder so ein typisches KI-Startup, das zwar Hype hat, aber eigentlich nur Geld verbrennt?
Max Quantum
Ganz und gar nicht, und das ist die eigentliche Überraschung. Gegründet wurde HeyGen 2020 von Joshua Xu und Wayne Liang, beide von der Carnegie Mellon University. Heute haben sie gerade mal 157 Mitarbeiter, stehen bei einer Bewertung von rund 500 Millionen Dollar und haben 74 Millionen Dollar Risikokapital eingesammelt. Das wirklich Verrückte ist aber: Sie machen nach nur etwa drei Jahren Wachstum bereits 100 Millionen Dollar Jahresumsatz -- und sind seit dem zweiten Quartal 2023 profitabel. [excited]
Eva Cortex
Warte, stopp. [astonished] Profitabel bei 100 Millionen Dollar Run Rate nach so kurzer Zeit? Das ist in der aktuellen Tech-Landschaft ja fast schon ein Einhorn-Muster. Wie halten die die Kunden so extrem stabil auf der Plattform?
Max Quantum
Weil sie sich tief in die operativen Workflows der Unternehmen hineinfressen. Das Preismodell ist simpel: Einzelkunden starten ab 29 Dollar im Monat, Teams zahlen mehr, und Enterprise-Kunden haben Volumenverträge. Aber der entscheidende Punkt ist: Wenn ein Unternehmen einmal seine gesamten Onboarding-Videos, Sales-Pitches oder Produktdemos in fünf Sprachen über HeyGen automatisiert hat, baut man das nicht mal eben wieder zurück. Der Wechsel zurück zu einer traditionellen Agentur mit wochenlangen Wartezeiten und enormen Kosten fühlt sich dann an wie der Rückschritt in die Steinzeit.
Eva Cortex
Klar, der Vergleich hinkt ja auch visuell sofort. Ein professionelles Synchronstudio braucht Sprecher, Regie, Studiozeit, endlose Korrekturschleifen und kostet schnell fünfstellige Beträge für ein paar Minuten Material. Wenn HeyGen das auf Minuten und ein paar Dollar runterrechnet, ist das mathematisch für jedes CFO-Hirn ein Nobrainer. [pauses] Aber ganz ehrlich: Wo ist hier der Haken?
Max Quantum
Der Haken liegt in den Nuancen. Die Lippensynchronisation ist nicht in jeder der über 40 Sprachen absolut perfekt. Kulturelle Feinheiten, feine Ironie oder lokale Redewendungen gehen bei der automatischen Übersetzung oft verloren. Da braucht es immer noch ein menschliches Auge, das drüberschaut. Wer alles blind automatisiert, riskiert peinliche Fehler.
Eva Cortex
Und dann ist da natürlich noch die Plattform-Abhängigkeit. [thoughtfully] Wenn man seine gesamte Video-Infrastruktur auf einem einzigen Tool aufbaut, ist man den Preiserhöhungen und Produktentscheidungen dieses Anbieters komplett ausgeliefert. Es ist eben ein echter Hebel -- aber kein Freifahrtschein für blindes Vertrauen.
Max Quantum
Absolut. Aber genau diese Reibung zeigt uns doch, wo die Reise hingeht: Wer heute den Kundenzugang über saubere, automatisierte Workflows besitzt, gewinnt den Markt. Nicht der mit der komplexesten Technologie, sondern der, der dem Kunden am meisten Zeit und Kopfschmerzen erspart. [calm]
Eva Cortex
Ein extrem spannendes Learning. Damit sind wir für heute auch schon am Ende dieser kurzen Episode. Danke fürs Zuhören bei unserem Quick Take, und bis zum nächsten Mal!
Max Quantum
Tschüss zusammen, bis zum nächsten Mal! [warmly]
