Video- und Bildgenerierung mit KI
Von VEO 3 bis Kling: Diese KI-Tools sprengen deine Kreativität

Ob hyperrealistische Fotos oder surreale Videoclips – die neuesten KI-Tools machen es möglich. Das sind die Favoriten der impulse-Chefredakteurin.

Aktualisiert am 9. Oktober 2025, 15:57 Uhr, von Nicole Basel, Chefredakteurin

Neun fotorealistische Bilder der impulse-Chefredakteurin in unterschiedlichen Outfits und mit verschiedenen Frisuren
impulse-Chefredakteurin Nicole Basel im Originial, als Läuferin, Bauarbeiterin, Rennfahrerin, Punk, Ärztin und im Stil der 20er, 60er und 80er Jahre.
© KI-generiertes Bild (Sora)

Wenn ich mich mit KI-generierten Videos beschäftige, schwanke ich zwischen Begeisterung und Unbehagen. Einerseits eröffnet sich ein gigantisches Potenzial: Selbst kleine Unternehmen können nun mit einfachen Mitteln professionelle Werbevideos oder Tutorials produzieren – direkt am Rechner, ohne großes Budget.

Andererseits macht mir die Entwicklung auch Angst. Denn jeder kann heute täuschend echte Fake-Videos erstellen. Es braucht keinerlei Digitalkenntnisse mehr, um eine beliebige Person etwas Absurdes sagen zu lassen. Das Risiko von Manipulation und Missbrauch steigt enorm. (Falls dein Unternehmen noch keine KI-Richtlinie hat, solltest du das dringend nachholen – hier findest du eine Vorlage.)

Die Zahl der Tools wächst rasant. Meine Auswahl ist zugegeben nicht exotisch – aber mit diesen Anwendungen lässt sich fast jedes erdenkliche Beispiel umsetzen.

1. Sora

Was kann Sora?

Sora ist ein Text-to-Image beziehungsweise Text-to-Video-Generator: Du beschreibst das Bild oder das Video, das du haben willst, so genau wie möglich, und Sora erstellt es für dich. Mittlerweile kann Sora auch den passenden Ton zu Videos mitliefern. Aktuell kann die KI allerdings noch keine Sprache erzeugen. Sora ist (wie derzeit quasi alle Tools im Standard-Tarif) nur für Kurzvideos geeignet, die Höchstdauer ist 10 Sekunden.

Was ist ein besonderes Feature bei Sora?

Sora ist ein soziales Medium. Das bedeutet: Du kannst die Bild- und Videokreationen anderer Nutzerinnen und Nutzer sehen und auch durchsuchen.

Einige mit Sora generierte Bilder unterschiedlicher Stile
© Sora KI-generierte Bilder von Sora-Nutzern

Besonders praktisch:

  1. Du kannst mit den Bildern der anderen Nutzer weiterarbeiten. Das bedeutet: Findest du ein Motiv, das dir gefällt, kannst du es auf deine Bedürfnisse anpassen.
  2. Du kannst einsehen, welche Prompts für ein bestimmtes Bild oder Video verwendet wurden und so dein eigenes Prompting verbessern.

Mit Sora kannst du Bilder und Videos nicht nur aus Text neu generieren, sondern vorhandenes Bild- und Videomaterial remixen, animieren oder mit neuen visuellen Stilen mischen. Es lassen sich Bilder und Videos in verschiedenen Formaten erstellen, etwa quadratisch oder hochkant. Das können zum Beispiel die Tools von Gemini (Google) nur bedingt.

Anwendungsbeispiel: Jahreszeiten anpassen

Drei Bilder einer gelben Tasse auf einem hölzernen Tisch. In jedem Bild zeigt der Hintergrund eine andere Jahreszeit.
© Sora Mit Sora generierte KI-Bilder

Wofür setze ich Sora ein?

Ich nutze Sora vor allem für kreative Aufgaben. Mein Eindruck ist, dass die KI besser als andere Tools in der Lage ist, komplexe Ideen so umzusetzen, wie ich sie mir vorgestellt habe.

Dieses impulse-Cover-Motiv habe ich zum Beispiel mit Sora erstellt.

Covermotiv eines impulse-Magazins © Sora

Bei der Videoproduktion gefallen mir bei Sora die Funktionen „Remix“, „Re-Cut“ und „Storyboards“, um die Videos genau an meine Vorstellung anzupassen.

Was kostet Sora?

Sora ist ein Bild- und Videotool von OpenAI, dem US-Konzern, der hinter ChatGPT steht. Du kannst das Tool nutzen, wenn du einen ChatGPT-Plus-Account hast. Ein ChatGPT-Plus-Account kostet 20 Dollar im Monat.­­­

Impulse-Akademie-Angebot
Marketingtexte schreiben - mit ChatGPT
Online-Workshop mit Nicole Basel
Marketingtexte schreiben - mit ChatGPT

Achtung: Redaktionsschluss für diesen Artikel war der 6.10.2025. OpenAI hat in den letzten Tagen Sora 2 auf den Markt gebracht, das aktuell nur für Kunden in Nordamerika und mit Einladungscode zugänglich ist. Sora 2 scheint den ersten Nutzerberichten zufolge deutlich bessere Ergebnisse zu erzeugen als Sora 1. Es soll bei Videos realistischer sein (gerade bei Bewegungen, wie zum Beispiel Sprüngen) und besser steuerbar. Außerdem kann Sora 2 Soundeffekte und Sprache (passend zu den Lippenbewegungen) generieren.

2. Nano Banana

Was kann Nano Banana?

Nano Banana ist Teil von Gemini, Googles KI-Assistent. Mit dem Tool lassen sich Bilder und Grafiken erstellen.

Die große Stärke von Nano Banana ist Konsistenz. Denn: Wenn man mit KI ein Bild verändert, wird es komplett neu erstellt. Dabei gibt es bei den meisten Tools kleine Abweichungen, was besonders bei Gesichtern auffällt. Bei den Beilspielbildern mit der gelben Tasse, die ich mit Sora erstellt habe, kannst du etwa sehen, dass sich die Maserung des Tisches verändert und auch der Zaun nicht komplett identisch ist.

Bei Nano Banana sind die Unterschiede kaum zu sehen. Dadurch ist das Tool besonders gut geeignet für die Erstellung von Portraits von Menschen. Oder für Produktfotos, wenn man etwa ein Produkt in unterschiedlichen Umgebungen präsentieren will.

Anwendungsbeispiel: Produktfotografie

Zweigeteiltes Bild: links ist das Cover eines impulse-Magazins zu sehen, rechts ist das Magazin auf einem Couchtisch liegend ín einem hell gehaltenen Raum zu sehen.
© Nano Banana Links: Ausgangsbild. Rechts: KI-generiertes Bild, erstellt mit Nano Banana. Beim Text auf dem impulse-Heft sind kleine Abweichungen zu erkennen.

Anwendungsbeispiel: Bildbearbeitung bei Personenfotos

impulse-Chefredakteurin Nicole Basel auf zwei sehr ähnlichen Fotos. Auf dem rechten Bild hat die Jeans eine dunklere Farbe.
© Nano Banana Links: Ausgangsfoto. Rechts: Mit Nano Banana generiertes KI-Bild. Nur die Farbe der Jeans hat sich verändert.

Anwendungsbeispiel: KI-generierte Personen in Bilder einfügen

Zwei ähnliche Abbildungen eines hellen Zimmers. Im rechten Bild ist ein Jugendlicher zu sehen, der auf der Bettkante sitzt.
© Nano Banana Links: KI-generiertes Ausgangsbild. Rechts: KI-Bild mit KI-generiertem Teenager in Teenagerpose.

Anwendungsbeispiel: Personen mit KI verändern

impulse-Chefredakteurin Nicole Basel auf zwei ähnlichen Fotos. Links mit längeren, blonden Haaren in einem Pferdeschwanz, rechts mit weißblondem Pixiecut.
© Nano Banana Links: Ausgangsfoto. Rechts: KI-generierte Chefredakteurin mit fragwürdiger Frisur.

Was kostet Nano Banana?

Nano Banana ist in das AI Studio von Google integriert. Das AI Studio ist – bei begrenzter Nutzung – kostenlos.

3. VEO

Was kann VEO?

VEO ist das Video-Tool von Gemini – und es bringt dieselbe Qualität mit wie Nano Banana: extreme Konsistenz.

Was ist ein besonderes Feature von VEO?

Andere Video-Tools machen noch häufig Logikfehler und zeigen zum Beispiel Gegenstände, die nicht auf dem Boden stehen, sondern in der Luft hängen. VEO erstellt dagegen extrem realistische Videos. Insbesondere die Animation von Menschen ist beeindruckend. Um dieses Video zu erstellen, habe ich ausschließlich ein frontales Foto von mir hochgeladen – aber selbst im Profil erkenne ich mich gut wieder. Das Video wurde mit VEO 2 generiert.

In eigener Sache
12 ChatGPT-Hacks für unverschämt gute Marketingtexte
12 ChatGPT-Hacks für unverschämt gute Marketingtexte
Smarte Prompts, mit denen du extrem schnell extrem starke Texte für Social Media, Newsletter, Salespages und Anzeigen erstellst

In VEO 3 kann man aktuell noch keine Referenzbilder hochladen, so dass man nur vollständig neue Videos generieren kann. Dafür kann VEO 3 aber den zum Video passenden Ton erzeugen: Musik, Geräusche und sogar Sprache, die ziemlich perfekt zu den Lippenbewegungen passt.

Was kostet VEO?

VEO ist – wie Nano Banana – Teil des AI Studio von Google. VEO 2 kann hier in begrenztem Umfang kostenlos genutzt werden. Wer VEO 3 nutzen will, braucht aktuell einen Bezahlzugang. Der erste Monat ist kostenlos. Danach kostet Google AI Pro 21,99 Euro pro Monat.

4. Kling

Was ist Kling?

Kling ist ein KI-Tool des chinesischen Unternehmens Kuaishou und kann Bilder, Videos und Sounds erstellen – auch Sprache.

Was ist ein besonderes Feature bei Kling?

Bei der Videogenerierung kann man einen Start- und einen End-Frame angeben, also das erste Bild und das allerletzte Bild festlegen. Damit hat man mehr Kontrolle darüber, was die KI macht. So ist es mit Kling zum Beispiel leicht möglich, Grafiken zu animieren. Im folgenden Video habe ich als Startbild das Balkendiagramm ohne Inhalt eingegeben – und als Schlussframe das ausgefüllte Diagramm. Entstanden ist das hier:

Außerdem kann man im Nachgang auch einzelne Frames oder einzelne Details eines Bildes bearbeiten. Kling fühlt sich in der Nutzung an wie eine Mischung aus KI-Tool und Videoeditor.

Was kostet Kling?

Ein Standard-Abo, mit dem man circa 3300 Bilder oder 33 Videos pro Monat generieren kann, kostet 79,20 Dollar pro Jahr.

In eigener Sache
12 ChatGPT-Hacks für unverschämt gute Marketingtexte
12 ChatGPT-Hacks für unverschämt gute Marketingtexte
Smarte Prompts, mit denen du extrem schnell extrem starke Texte für Social Media, Newsletter, Salespages und Anzeigen erstellst
Mehr lesen über