Meta stellte am 4. Oktober eine KI-Suite namens „Movie Gen“ vor, die fotorealistische Filme mit einer Länge von bis zu 16 Sekunden erzeugen kann, komplett mit Soundeffekten und Hintergrundmusik.

Movie Gen ist nicht das erste multimodale KI-Modell, das in der Lage ist, aus einfachen Texteingaben Video- und Audiodaten zu generieren, aber es scheint die bisher fortschrittlichsten Fähigkeiten in diesem Bereich zu demonstrieren. Die Forscher, die für die Entwicklung der Anwendung verantwortlich sind, behaupten, dass sie konkurrierende Systeme in menschlichen Tests bereits übertrifft.

Aufnahme aus einem von Meta Movie Gen erzeugten Video. Quelle: Meta

Movie Gen

Laut einem Blogbeitrag von Meta ist Movie Gen derzeit in der Lage, Filme mit einer Länge von bis zu 16 Sekunden bei einer Bildrate von 16 Bildern pro Sekunde (FPS) auszugeben. Zum Vergleich: Hollywood-Filme wurden vor dem digitalen Zeitalter traditionell mit 24 FPS gedreht, um den sogenannten „Film-Look“ zu erzielen.

Während höhere FPS-Raten bei Spielen und anderen grafischen Anwendungen als besser angesehen werden, sind die 16 FPS von Meta also nicht weit von dem entfernt, was man als professionelle Filmqualität bezeichnen würde.

Die Movie Gen-Modelle können auf der Grundlage einfacher Texteingaben völlig neue Filme erstellen oder vorhandene Bilder oder Videos verändern, um Objekte und Hintergründe beliebig zu ersetzen oder umzugestalten.

Aufnahmen aus einem Video, das auf drei verschiedene Arten von Movie Gen editiert wurde. Quelle: Meta

Die fortschrittlichste Neuerung ist jedoch die Fähigkeit der KI-Suite, bis zu 45 Sekunden Audio mit Soundeffekten und Hintergrundmusik zu erzeugen. Nach Angaben von Meta integriert und synchronisiert Movie Gen dabei den Ton mit der Bewegung in den erzeugten Videos.

Nur zu Forschungszwecken

Meta hält die Grundmodelle von Movie Gen vorerst allerdings noch unter Verschluss. Das Unternehmen hat keinen Zeitrahmen für die Markteinführung des Produkts genannt und betont, dass es vor der Einführung noch weitere Sicherheitstests benötigt.

Dahingehend heißt es in einem Forschungspapier des KI-Teams von Meta:

„Die Movie Gen Modelle wurden zu Forschungszwecken entwickelt und müssen noch umfassend verbessert werden, bevor sie eingeführt werden können ... und wenn wir diese Modelle einführen, dann werden wir Sicherheitsfunktionen einbauen, die Eingabeaufforderungen oder Erstellungsanweisungen zurückweisen können, die gegen unsere Richtlinien verstoßen, um Missbrauch zu verhindern.“

Melde dich bei unseren Sozialen Medien an, um nichts zu verpassen: X, YouTube, Instagram und Telegram – aktuelle Nachrichten, Analysen, Expertenmeinungen und Interviews mit Fokus auf die DACH-Region.