"Sora" produziert Videos nur mit KI

26. Februar 2024

Open AI hat den Videogenerator Sora vorgestellt, der aus Textanweisungen täuschend echte Videos produziert.
Die Videos sind bis zu einer Minute lang und stellen „aktuell alles in den Schatten, was KI bislang an Bewegtbild generiert hat“, so Beobachtende.
Sora ist nicht öffentlich zugänglich, nur Sicherheitsforschende und Künstler und Künstlerinnen können mit der KI bislang experimentieren.

„Zu hören, dass es all diese Dinge kann, ist eine Sache, aber die Fähigkeiten tatsächlich zu sehen, war überwältigend.“

Der US-Schauspieler, Filmemacher und Studiobesitzer Tyler Perry zu Sora

Von tollenden Hundewelpen bis zum Cyberpunk

Der Konzern hinter ChatGPT hat auf seiner Website 48 von KI-produzierte Videos hochgeladen. Die Clips sind bis zu 60 Sekunden lang und zeigen 3-D-Animationen wie fotorealistische Szenen. Zu sehen sind z.B. im Schnee spielende Hundewelpen, bei denen wir die einzelnen Schneeflocken sehen und die einzelnen Haare der Hundefelle sich bewegen. Oder wir fahren mit dem Zug durch einen Vorort von Tokio, im Fenster spiegeln sich die Mitfahrenden im Zug u.a. eine junge Frau, die aus dem Fenster schaut. In einer 3D-Animation schauen wir in die Straßen von New York, dass wie Atlantis versunken scheint. Auf unserer Kamerafahrt durch die Straßen sehen wir Wale, Haie und Schildkröten, die zwischen den Hochhäusern schwimmen. OpenAI hat für diese Clips die Fähigkeiten seiner Tools ChatGPT und Dall-E kombiniert. „Sora ist in der Lage, komplexe Szenen mit mehreren Charakteren, bestimmten Bewegungsarten und präzisen Details des Motivs und Hintergrunds zu erstellen,“ heißt es von OpenAI auf der Website. Die veröffentlichten Instruktionen an die Künstliche Intelligenz, also die Prompts, sollen das Sprachverständnis des Modells zeigen, „das es ihm ermöglicht, Aufforderungen genau zu interpretieren und überzeugende Charaktere zu generieren, die lebendige Emotionen ausdrücken.“ Tatsächlich beeindrucken die kurzen Videos u.a. durch ihre Detailgenauigkeit – auf den ersten Blick.

Zusammenfassung der Sora-Produktionen von Open AI

Weltweite Fehlersuche

Kaum war der erste Begeisterungssturm über die KI-generierte Videos durchs Netz gezogen, mehrten sich die Kritiken. Immer mehr Fehler wurden entdeckt und angemerkt, die vermeintlich perfekte KI-Wirklichkeit bekam Risse. So hat die braun-weiß gestreifte Katze, die im Bett sanft eine schlafende Frau anstupst, im Video (siehe hier den Post von Verge-Chefredakteur Tom Warren auf X ehemals Twitter) plötzlich drei Pfoten. In einem anderen Clip wechselt die Zahl der miteinander spielenden, jungen Wölfe - mal sind es drei, mal vier, mal ist die Zahl nicht definierbar.

Und bei der faszinierenden Kamerafahrt über eine Kirschblütenallee im verschneiten Tokio steigen die Schneeflocken zu Beginn auf und ein Bus fährt am Rande des Bildes einfach über ein Auto drüber. Es scheint sich der „ChatGPT-Effekt“ zu wiederholen – auf den ersten Blick wirkt alles sehr perfekt und verständlich, auf den zweiten Blick offenbaren sich eine Vielzahl von Fehlern bzw. Artefakten.

Tor auf für perfekte Deepfakes?

„Wie bei anderen Techniken der generativen KI gibt es keinen Grund zu der Annahme, dass sich Text-to-Video nicht weiterhin rasch verbessern wird – was uns einer Zeit immer näherbringt, in der es schwierig sein wird, die Fälschung von der Realität zu unterscheiden,“ sagt der KI-Experte Hany Faid von der University of California in Berkeley. Er warnt davor, dass die mit Sora produzierten Videos in der Kombination mit Stimmklonen „eine völlige neue Front“ von Deepfakes zur Folge haben könnte. Viele Wissenschaftler und Wissenschaftlerinnen warnen vor der Gefahr, die solche Deepfakes besonders z.B. im Vorfeld vor Wahlen haben könnten. Die Jenaer Kommunikationswissenschaftlerin Edda Humbrecht warnt beispielsweise von der Gefahr, dass solche Deepfakes dazu beitragen könnten, „falsche Narrative zu verstärken oder politische Gegner in ein schlechtes Licht zu rücken.“ Bislang hat OpenAI die neue KI-Technologie allerdings (noch) nicht veröffentlicht und verspricht recht schwammig: „Wir werden mehrere wichtige Sicherheitsmaßnahmen ergreifen, bevor wir Sora in den Produkten von OpenAI verfügbar machen.“

OpenAI kein bisschen open

Neben der Begeisterung über die Bildgewalt der KI-Clips und den Bedenken um die Wirkung von KI-Deepfakes, regt sich auch Kritik an OpenAI selbst. Denn von der im Namen versprochenen Offenheit sei bei den Fragen zur Programmierung von Sora nichts zu bemerken. Der Social Media Watchblog, ein Newsletter der deutschen Journalisten Martin Fehrensen und Simon Hurtz zu den wichtigsten News rund um Social Media, bemerkt mit Bezug auf mehrere amerikanische Medien: OpenAI würde weder etwas zum Ressourcen-Aufwand hinter der Produktion der Clips sagen, noch würde es darüber informieren, welche Daten für das Training von Sora genutzt wurden. Eventuelle Copyright-Fragen bleiben somit (bislang) auch unbeantwortet. Diese Geheimhaltung wäre nicht vertrauensstiftend.

Doch bei aller Kritik und allen Einwänden – Staunen ist erlaubt! Hier sind alle Videos von OpenAi zu finden - viel Spaß beim Durchbingen:

https://openai.com/sora

Der wöchentliche Blick ins Web

Eine Person die eine Computertastertur mit Maus bedient

Das Internet schläft nicht - ständig gibt es neue Trends, neue Plattformen, neue Apps und täglich Veränderungen. Mit uns behaltet ihr den Überblick - denn wir präsentieren Ihnen hier jede Woche was es Neues gibt in der digitalen Welt.

Alle Netzklick-Themen im Überblick