Ein neues Interview mit dem Regisseur hinter dem viralen Sora-Clip Air Head hat ergeben, dass KI bei seiner Produktion eine geringere Rolle gespielt hat als ursprünglich behauptet.
Patrick Cederberg (der die Postproduktion für das virale Video übernommen hat) enthüllte in einem Interview mit Fxguide, dass nun bestätigt wurde, dass das Text-zu-Video-Programm von OpenAI bei weitem nicht die einzige Kraft war, die an der Produktion beteiligt war. Der 1-minütige und 21-sekündige Clip wurde mit einer Kombination aus traditionellen Filmtechniken und Nachbearbeitung erstellt, um das Aussehen des endgültigen Bildes zu erzielen.
Air Head wurde von ShyKids gemacht und erzählt die Kurzgeschichte eines Mannes mit einem Ballon im wahrsten Sinne des Wortes als Kopf. Obwohl menschlicher Voice-Over verwendet wird, erweckte die Art und Weise, wie OpenAI den Clip auf sozialen Kanälen wie YouTube verbreitete, sicherlich den Eindruck, dass die visuellen Elemente ausschließlich von KI angetrieben wurden, aber das stimmt nicht ganz.
Wie im Hinter-den-Kulissen-Clip zu sehen ist, hat ShyKids eine Menge Arbeit geleistet, indem sie die Rohausgabe von Sora übernommen und dabei geholfen haben, sie in das fertige Produkt umzuwandeln. Dazu gehörte das manuelle Rotoskopieren der Hintergründe, das Entfernen der Gesichter, die gelegentlich auf den Ballons erschienen, und die Farbkorrektur.
Dann ist da noch die Tatsache, dass Sora eine Menge Zeit braucht, um die Dinge tatsächlich richtig zu machen. Cederberg erklärt, dass es „Hunderte von Generationen mit 10 bis 20 Sekunden pro Stück“ gab, die dann genau bearbeitet wurden, was das Team als „300:1“-Verhältnis zwischen dem, was erzeugt wurde, und dem, was für weitere Nachbesserungen vorbereitet wurde, bezeichnete.
Zu dieser manuellen Arbeit gehörte auch das Herausschneiden des Kopfes, der immer wieder auftauchte, und sogar das Ändern der Farbe des Ballons selbst, der rot statt gelb erschien. Während Sora verwendet wurde, um die ersten Bilder mit guten Ergebnissen zu erzeugen, passierte hinter den Kulissen offensichtlich noch viel mehr, damit das fertige Produkt so gut aussieht, wie es ist, sodass wir von einem sofort erstellten Film noch weit entfernt sind. hochwertige Produktionen.
Sora bleibt streng geheim, bis auf eine Handvoll sorgfältig kuratierter Projekte, die an die Öffentlichkeit gelangt sind, darunter Air Head zu den beliebtesten. Der Clip hat zum Zeitpunkt des Schreibens über 120.000 Aufrufe, wobei OpenAI als „Experiment“ mit dem Programm anpreist und die offensichtliche Arbeit, die in das Endprodukt geflossen ist, herunterspielt.
Sora ist beeindruckend, aber wir sind nicht überzeugt
Während OpenAI durch das große Sprachmodell gute Arbeit geleistet hat, um zu zeigen, was sein Text-zu-Video-Dienst leisten kann, ist der Mangel an Transparenz besorgniserregend.
„Air Head“ ist ein beeindruckender Clip eines talentierten Teams, der jedoch einer Menge Bearbeitung unterzogen wurde, um das Endprodukt dahin zu bringen, wo es im Kurzfilm steht.
Es ist nicht ganz der „Ein-Klick-und-fertig“-Ansatz, als den ihn viele der Technologie-Booster dargestellt haben. Es stellt sich heraus, dass es sich lediglich um ein Werkzeug handelt, mit dem Bilder verbessert werden können, anstatt etwas von Grund auf neu zu erstellen, was in der Videoproduktion bereits häufig vorkommt und Sora weniger revolutionär erscheinen lässt, als es zunächst den Anschein machte.