Videos per Textprompt
Einen passenden Prompt eingeben und ein perfektes Video samt Tonspur erhalten? Meta macht es angeblich möglich. Muss die Filmindustrie sich fürchten oder handelt es sich nur um eine nette Spielerei, die Herr Zuckerberg da in den Medien ankündigt?
Angeblich soll "Movie Gen" in der Lage sein, realistische Videos aus einem kurzen Textprompt zu generieren. Zuckerberg lässt verlauten, dass die KI so mächtig sei, dass selbst Hollywood und nicht nur Influencer auf Instagramm davon profitieren könnten. Movie Gen produziert nicht nur Videos sondern auch die passenden Audiotonspuren.
Erste Videobeispiele wurden bereits gepostet. etwa ein Baby-Hippo, welches zwischen farbigen Blüten im Wasser taucht, Pinguine, die seltsame Kleidung tragen oder eine Frau, die neben einem Geparden Gymnastik macht, ohne diesen zu bemerken. Die Beispiele sehen noch etwas künstlich aus, aber eher aus kreativen Entscheidungen heraus, nicht wegen der technischen Umsetzung. Über die Rechenzeiten hält man sich noch bedeckt, aber man muss davon ausgehen, dass es ziemlich lange Renderzeiten sind, um all die Einzelbilder (30 bzw. 25 Blder /Sekunde) zu generieren.
Besondere Merkmale
Meta steht mit seinem Videogenerator nicht allein da, Microsoft hat mit VASA-1 und OpenAI mit Sora ebenfalls "realistische“ Videos angekündigt, welche aus simplen Textaufforderungen von der KI generiert werden. So richtig am Start ist mit Stand Oktober 2024 noch keine der Anwendungen, allerdings scheint Meta mit "Movie Gen" durch die Möglichkeit, bereits existierende Videos per Textprompt zu bearbeiten und generierten Ton hinzuzufügen, mehr zu bieten, als die Konkurrenz.
Das Versprechen von Meta lautet, dass man sowohl Videos völlig frei generieren kann, indem man im Prompt angibt, was im Bild zu sehen sein und welchen Ablauf es haben solll, als auch vorhandene Videos nach Wunsch verändern kann. Editieren durch Texteingabe, inklusive Farbänderungen, Stilanpassungen und Übergängen. Noch sehen die Videobeispiele ziemlich künstlich, um nicht zu sagen "Cheesy" aus, doch wer weiß, die Entwicklung steht ja erst am Anfang. Interessant scheint die Möglichkeit die ursprünglichen Inhalte zu behalten und nach Wunsch punktuelle Veränderungen hinzuzufügen, etwa so wie man es bei Adobes Photoshop dank KI bei Standbildern machen kann. Auch soll es möglich werden aus Fotos animierte Sequenzen zu genieren.
Wie bei jeder KI stellt sich natürlich auch die Frage, womit diese trainiert wurde. Vermutlich wurden all die Videos von Facebook-Usern verwendet, schließlich haben diese die Rechte an den Videos durch die Veröffentlichung auf Facebook an Meta abgetreten. Dass das Tool sich für die Herstellung von Deep Fake Videos eignet, steht auf einem anderen Blatt.
Allzu hoch ist die Gefahr nicht, dass Hollywood nun sofort seine Kreativen gegen die KI auswechselt, einerseits sind die Einstellungen auf 45 Sekunden begrenzt, außerdem werden die großen Filmkonzerne wenig Freude am eingeblendeten Meta-Wasserzeichen haben.