So langsam kommen immer mehr durch die Künstliche Intelligenz angetriebene Videogeneratoren auf den Markt. Große Konzerne wie Meta, Microsoft oder Open Ai liefern sich da ein Rennen. Der Sora Videogenerator ist ab sofort für Jeden verfügbar und produziert aus Textprompts realistische Videoszenen. Open AI hatte ja bereits in Zusammenarbeit mit dem Tribica Filmfestival eine Reihe von KI Videos die mit Sora erstellt wurden, präsentiert.
OpenAI hat Ende 2024 seinen viel diskutierten und gelobten Sora-Videogenerator für alle zugänglich gemacht. Es ist damit Bestandteil der bezahlten ChatGPT Nutzungen, allerdings gibt es in den verschiedenen Abos gewisse Unterschiede. So ist es für ChatGPT Plus-Abonnenten möglich, pro Monat bis zu fünfzigundzwanzig Sekunden Video in 480 Pixel Auflösung zu generieren. Pro-Abonnenten hingegen dürfen unbegrenzt Videos mit langsamerer Geschwindigkeit oder fünfhundert Sekunden mit der höchsten Geschwindigkeit erzeugen.
Allerdings wird nicht die gesamte Welt mit diesem Angebot versorgt,- aus nicht ganz unberechtigten rechtlichen Gründen wird es vorerst in Großbritannien und der Europäischen Union nicht angeboten.
Noch steht die Generierung von Videos aus Textprompts am Anfang, sie wird permanent weiter trainiert um die Ergebnisse zu verbessern. Die Hersteller der verschiedenen KI Videogeneratoren halten sich bedeckt, mit welchen Materialien sie ihre KI trainieren, da sie aber damit argumentieren, dass alle Videos die frei im Internet zugänglich sind, so etwa wie Public Domain und rechtefrei seien, ist davon auszugehen dass YouTube zu den wichtigsten Trainingsquellen gehört.
Zu Sora wurde eine Webseite eingerichtet auf der Anwender ihre mit Sora erstellten Ergebnisse präsentieren können. Dabei werden die Videos und die jeweils für das Ergebnis verwendeten Textprompts nebeneinander dargestellt.
Unperfekt aber beeindruckend
Bei den bisher veröffentlichten Beispielen finden sich häufig Anzeichen für den künstlichen Ursprung der Videos, manche Elemente in den Videos sind chaotisch zusammengesetzt und auch die Bildauflösung ist nicht konstant. Trotzdem sehen sie ziemlich realistisch aus.
Um auf die generierten Ergebnisse Einfluss nehmen zu können, gibt es ein Remix-Tool mit dem man die bereits erstellten Videos weiter verändern kann. Zusätzliche Textprompts verändern die Videos weiter. Die einzelnen Clips kann man in Sora in einer Art Timeline zusammenfügen, so wie man das von einfachen Schnittprogrammen kennt.
Ähnlich wie bei KI Bildgeneratoren wird auch viel Unsinn von der KI erstellt, es ist wirklich schwer, durch die Texteingaben die KI präzise zu steuern. Vielmehr entstehen oft zufällige Ergebnisse, eine vollständige künstlerische Kontrolle sieht anders aus. Und wie jede KI bisher neigt auch Sora zu Halluzinationen. Manche Bildelemente tauchen einfach auf oder verschwinden plötzlich. Darüber hinaus tut sich Sora mit physikalischen Gesetzmäßigkeiten wie Schwerkraft, Geschwindigkeit etc. sehr schwer.
Da ist also noch viel Luft nach oben und es benötigt Kreative, die all diese Dinge so weit überarbeiten und korrigieren, dass die Ergebnisse präsentabel sind. Noch also werden die Menschen benötigt für die Erzeugung von Filmen und es scheint so, als wenn das noch lange so bleiben wird. Sora soll vorerst ein Tool bleiben mit dem man keine vollständigen Filme wird generieren können, sondern nur einzelne Einstellungen, ein Tool was die Möglichkeiten von Kreativen erweitern soll.
Aber speziell im Bereich Visual Effects können sich Einsparpotenziale eröffnen, noch können die generierten Effekte qualitativ nicht mit professionelle erstellter VFX mithalten, sie sehen eher etwas primitiver aus. Auch für Betrüger könnten Fake-Videos leichter zu erstellen sein, wobei Open AI angeblich viele Einschränkungen implementiert hat, was die Generierung von Inhalten mit Menschen angeht.
https://sora.com/