Schlagwort: Frage

ChatGPT Images 2.0 Tutorial: Prompts und Tipps 2026

GPT-Images-2.0

Inhaltsverzeichnis
▾

Ressourcen
▾

01. Formate und Auflösungen
02. Fotorealismus und gesperrte Bilder
03. Thinking Modus + Live Daten
04. Comics in einem Rutsch
05. Unterschiedliche Sprachen
06. Marketing Ideen
07. So gehts weiter
11. FAQ – Fragen & Anworten

ChatGPT Webseite
ChatGPT Hilfe-Center

Heute lernst du, wie du ChatGPT Image 2.0 perfekt nutzt und welche neuen Möglichkeiten dir das Modell bietet. Außerdem erfährst du einen simplen Trick, wie du Menschen generierst, ohne dass ChatGPT den Vorgang blockiert. Du nutzt alle Prompts wie immer direkt mit »Copy & Paste« für deine eigenen Projekte. In den nächsten Tagen folgen zudem mindestens zwei weitere Prompting-Artikel. Bookmarke diese Seite also unbedingt! In der Gallerie gibt es einen kleinen Vorgeschmack:

Kategorie: Prompting & Bilder
Bilder mit ChatGPT-Images-2.0 erstellen

Einsteiger
Level

Dauer
5 – 30 Min.

Kosten
Kostenlos*

Software
Browser / App

Das bekommst du in diesem Tutorial:

Exklusive Copy/Paste Prompts
Tipps zu ChatGPT-Images-2.0

ChatGPT öffnen & starten

Hinweis: Du benötigst einen (kostenlosen) ChatGPT Account, um mitzumachen.

01.
Formate und Auflösungen
Bisher warst du bei ChatGPT auf die Standardformate 1:1, 3:2 und 2:3 limitiert. Jetzt erstellst du nahtlos alles zwischen 3:1 und 1:3. Damit hast du sogar mehr Formate zur Auswahl als bei Nano Banana. Gerade 16:9 und 9:16 sind heute extrem wichtig. Du musst deine Bilder nachträglich nicht mehr mühsam zuschneiden. Selbst extreme Panorama-Fotos wirken mit dem 3:1 Format richtig stark. Platziere dein gewünschtes Format dafür einfach irgendwo im Prompt. Ich setze es meistens ganz an das Ende. + +

Berlin Panorama

Copy

create a photorealistic panorama shot as if taken on iphone of Berlin at the Brandenburg Gate. 3:1

Prompt vollständig anzeigen

Du wählst auch die Auflösung und die Qualitätsstufe. Das funktioniert allerdings nicht direkt in der Weboberfläche von ChatGPT. Dort erhältst du je nach Abo meist nur die Stufe „Medium“ und eine Auflösung von 1k oder 2k automatisch zugeordnet. Fragst du das Modell hingegen über die API oder Dienste wie Higgsfield an, bestimmst du Qualität (Low, Medium, High) und Auflösung (1k, 2k, 4k) frei. Beachte dabei die stark variierenden Kosten. Bei Higgsfield kostet ein Standard-Bild in 1k genau 2 Coins. Ein Bild in der Stufe High mit 4k-Auflösung kostet dich schon 12 Coins. Du erhältst also 6 Standard-Bilder für den Preis von einem Hochglanzbild. +
02.
Fotorealismus und gesperrte Bilder
Fotorealistische Bilder haben sich extrem verbessert. Sie sehen nicht nur echter aus, du steuerst die Ergebnisse auch viel präziser. ChatGPT Image 2.0 versteht Fachbegriffe aus der Fotografie exzellent. Bist du Fotograf, liefert dir dieses Modell exakt dein Wunschergebnis. Nutze „photorealistic“ immer als Grundbegriff. Diesen verfeinerst du dann nach deinen Vorstellungen. Der für mich wichtigste Style ist der typische iPhone-Style. Das Bild soll wirken, als hättest du gerade beiläufig einen Schnappschuss mit dem Smartphone gemacht. +

iPhone Style

Copy

A photorealistic iPhone photo of two super heroes sitting at an outdoor cafe in late afternoon, taken casually by someone at the table. Half-finished drinks, uneven sunlight, relaxed posture, slightly imperfect framing, and the natural realism of a real everyday phone snapshot.

Prompt vollständig anzeigen

Pro-Tipp: Abbrüche gezielt umgehen
Ab und zu bricht ChatGPT Image 2.0 bei der Generierung von Personen ab. Viele deutsche Nutzer halten das für eine feste Vorgabe von OpenAI. Greifst du jedoch über die amerikanische API bei Anbietern wie Higgsfield zu, funktionieren diese Prompts auf einmal fehlerfrei.

Es geht aber noch einfacher: Verbinde dich kurz per VPN mit einem Server in den USA. Schlägt dein erster Versuch fehl, schaltest du das VPN ein und schreibst in den Chat: „try again“. Der identische Prompt funktioniert nun auf magische Weise.

Besonders bei Gemini und Nano Banana kommst du ohne diesen Trick kaum noch ans Ziel. In Deutschland und Europa gelten einfach härtere Richtlinien. Diese haben aber meiner Meinung nach keinen Effekt, wenn die Rest der Welt es anders macht.

Hier siehst du einen Prompt, bei dem ChatGPT abbricht. Jetzt aktivierst du das VPN mit dem Zielland USA und schreibst einfach „try again“. Und schon bekommst du dein Ergebnis! + + Hier folgt eine kurze Empfehlung für unsere Partner NordVPN und Higgsfield. NordVPN bietet dir bis zu 75 % Rabatt und liefert viele schnelle Standorte in den USA. Gesperrte KI-Funktionen oder Features, die erst später nach Europa kommen, sind damit absolut kein Problem mehr. Zusätzlich streamst du mit einem Bezahl-VPN auch Filme und Serien, die in Deutschland nicht verfügbar sind. ANZEIGE Bei Higgsfield greifst du automatisch über eine API auf ChatGPT Image 2.0 zu. Du hast dort keine Beschränkungen. Das lohnt sich vor allem, wenn du nicht ständig zwischen Anbietern wechseln willst und immer die besten Modelle suchst. Aktuell sind das ChatGPT Image 2.0 und Seedance 2.0 für Videogenerierung. ANZEIGE Willst du kein Geld ausgeben, nutzt du bei wenig Volumen einfach einen kostenlosen VPN-Anbieter. Du musst für diesen Trick also nicht zwingend bezahlen. Retro-Look Hier siehst du, wie das Prompting mit Fachbegriffen aus der Fotografie funktioniert. Einfache, aber präzise Angaben wie „shot on 35mm film“ liefern hervorragende Ergebnisse. Mit dieser Angabe erhältst du garantiert ein stimmiges Retro-Bild. +

Retro Fotographie

Copy

A photorealistic candid travel scene of a young womand standing at a coastal roadside turnout on an overcast morning, shot on 35mm film. Natural imperfect framing, visible grain, ambient light, muted colors, wind in clothing and hair, cinematic realism, and the feeling of a lived-in documentary photograph.

Prompt vollständig anzeigen

Hochglanz-Magazin Das Problem bei Fotografie-Fachbegriffen: Die meisten Nutzer kennen sie nicht. Frage ChatGPT daher im Vorfeld, was der aktuelle Stand der Technik für ein bestimmtes Motiv ist. Der erste Prompt erzeugt also nicht direkt das Bild, sondern schreibt deinen Bild-Prompt. Du fragst das System, welche Kamera und welche Einstellungen aktuell für Hochglanzfotos in der Vogue das beste Ergebnis liefern. +

Hochglanz Fotographie

Copy

Raw photo of a beautiful female fashion model, wearing a sleek silk dress, editorial fashion photography, Vogue magazine style. Shot on Hasselblad H6D-100c, 85mm lens, f/2.8, ISO 100, 1/200s. Professional studio lighting, beauty dish, catchlights in the eyes, sharp focus, ultra-detailed, hyper-realistic, glossy magazine aesthetic, 8k resolution –ar 4:5

Prompt vollständig anzeigen

03.
Thinking Mode für Live-Daten
Das nächste große Thema ist der Thinking Mode. Du brauchst dafür das Plus-Abo und musst dann oben den Thinking-Modus auswählen. ChatGPT denkt dann über den Prompt nach und verknüpft ihn mit seinem Wissen (Stand Dezember 2025) sowie einer aktuellen Live-Suche. Zusammen mit der Fähigkeit, Text zu 100% akkurat abzubilden, hast du jetzt völlig neue Möglichkeiten. Comics, Zeitungen, Infografiken, Marketing, alles kein Problem mehr. Im ersten Beispielen sehen wir eine Zeitung mit aktuellen News (22. April 2026) von heute: +

Live Zeitung

Copy

Create a newspaper for me in the style of 1920s American newspapers, but with today’s news (April 22, 2026).

Prompt vollständig anzeigen

Das zweite Beispiel ist noch interessanter und schwieriger für das Modell. Die Schachspielerin Anna Cramling hat vor einiger Zeit das sogenannte Cow-Opening vorgestellt. Wir geben dem Modell keine konkreten Informationen, sondern wollen das einfach grafisch aufbereitet sehen: +

Erklär-Grafiken

Copy

Ein Bild von Anna Cramlings „Cow Opening” in seiner typischen Stellung, das zeigt, warum die Stellung so heißt. Rechts davon sind die Züge im typischen Schachstil zu sehen, die dafür notwendig sind. Im Hintergrund ist das Konterfei von Anna Cramling in einer sehr dezenten Strichzeichnung zu sehen.

Prompt vollständig anzeigen

04.
Comics in einem Rutsch
Hier sprechen wir zwei Dinge an. Einerseits fertigst du einzelne Comic-Seiten auf extrem hohem Niveau an, da das Modell perfekten Text schreibt. Andererseits generiert ChatGPT Image 2.0 durch eine neue Funktion bis zu 8 zusammenhängende Bilder auf einmal. Du denkst dir 8 Comic-Seiten aus, schreibst die Handlung und lässt sie direkt passend zusammen generieren. Willst du einen Comic mit 24 Seiten erstellen, gibst du die vorderen Seiten einfach als Stilreferenz mit. So baust du nach und nach in kurzer Zeit ein ganzes Heft auf. Die Charaktere und Objekte bleiben dabei über alle Bilder hinweg identisch. + + + +

Anime / Manga

Copy

Image 1: Make a sample page of a colorized Japanese Soccer manga like „Die Kickers“, but modern. The page should vividly depict our main character scoring the decisive goal in a match. Make the scene dramatic. For the German market with German text.

Image 2: After the game, both teams thank each other for a fair match. Then it’s time for the award ceremony.
Image 3: That night, the team celebrates wildly and throws a party. only 1 big Panel.
Image 4:The next morning, everyone arrives at the training ground feeling very tired and worn out and does some light exercises to cool down.

Prompt vollständig anzeigen

05.
Unterschiedliche Sprachen
Die bessere Unterstützung von Sprachen ist eine weitere riesige Neuerung. Bisher lieferten oft nur englische Prompts exzellente Ergebnisse. Lateinische Sprachen wie Deutsch funktionierten ordentlich. Jetzt versteht das Modell aber auch Sprachen wie Japanisch oder Koreanisch fehlerfrei. Damit skalierst du deine Bilder, Comics und Poster problemlos für die ganze Welt. Du passt den Stil exakt an einen bestimmten Markt an, inklusive perfekter Übersetzung. + +

Sprache ändern

Copy

Create two new versions of this for a different target market:

1: Japanese version
– Text in Japanese
– Players with Japanese appearances

2: Korean version
– Text in Korean
– Players with Korean appearances

Prompt vollständig anzeigen

Das Modell ändert deinen Text nicht nur in andere Sprachen. Es passt auch Details wie Spielernamen auf dem Rücken direkt für den entsprechenden Sprachraum an. Du änderst die Spieler sogar optisch. Sind in Deutschland blondes Haar und der Name Becker normal, passt du das mit nur einem Wort im Prompt an. Genauso wandelst du deinen deutschen Comic fehlerfrei in eine asiatische Version um. Nimm deinen deutschen Comic und ändere ihn durch Prompting in die japanische oder amerikanische Welt. Du bereitest deine Story so dreimal unterschiedlich für drei verschiedene Märkte perfekt auf.
06.
Marketing Ideen
Zum Abschluss betrachten wir die wahrscheinlich größte Verwendungsmöglichkeit: Marketing! In der Qualitätsstufe High und in 4k ersetzt du damit zu 99 %, was aktuell ganze Marketingteams leisten. Das schließt komplette Fotoshootings incl. Nachbearbeitung mit ein. Außergewöhnliches Marketing Im Gegensatz zu Standard-Sachen können wir jetzt unserer Fantasie freien Lauf lassen und Dinge darstellen, die noch vor Kurzem überhaupt nicht oder nur mit sehr viel Aufwand möglich waren. +

Gummistiefel Marketing

Copy

A high-fashion surrealist advertising poster for rubber boots. The scene is set in a minimalist, monochrome light blue studio with a semi-reflective floor.
The central focus is an oversized, giant white rubber boots clog positioned on its heel at a diagonal angle, serving as a backrest. A fashion model (1.80m, Swedish) with long blond hair, dressed in a clean, all-white coordinated sweatshirt and wide-leg trousers, leans her entire back against the giant one rubber boot in a relaxed, leaning posture. She is facing right in profile, looking ahead with a serene expression, and wearing standard-sized white rubber boots.
In the background, the word „RUBBER“ is written in massive, bold, white condensed sans-serif typography, partially occluded by the giant rubber boots and the model to create a sense of depth. At the top right, „Designed by all-ai.de“
At the bottom center, a white sans-serif tagline reads: „Made for comfort, worn for confidence. Because life feels better when you feel safe.“ The lighting is soft, cool, and even, casting gentle shadows and a soft reflection of the subjects on the glossy blue floor. The overall aesthetic is clean, modern, and high-concept.

Make the aspect ratio 3:4

Prompt vollständig anzeigen

Hochglanz-Magazin Die Magazine sehen mit kostenlosen Models und perfekter Typografie unglaublich professionell aus. Wenn im nächsten Monat die Person und der Text wechseln, haben wir das in einer Minute geändert. +

Hochglanz Cover

Copy

A luxury high-fashion magazine cover. Magazine name at the very top in massive elegant serif font reads „ALL-AI“ — the letters are large, slightly transparent/ghost-style overlapping the model’s head just like ELLE magazine, in soft platinum silver color blending into the background.
Character: A young beautiful white woman, early 20s, soft feminine features, big blue eyes, naturally full lips, flawless porcelain skin, subtle makeup — rosy cheeks, nude lips, defined brows. Her hair is platinum blonde, long and wavy, loosely flowing over one shoulder. She looks directly into the camera with a soft yet powerful gaze. Slight tilt of the head, naturally elegant posture.
Outfit: She is wearing a dramatic deep burgundy wine-red ballgown — structured corset top with off-shoulder neckline, voluminous layered satin skirt billowing around her dramatically. Behind her shoulders, large sculptural fabric rises like rose petals — same architectural drama as reference. She leans slightly forward, both hands resting gently on her knees.
Background: Pure soft warm white/ivory background — completely clean, minimal, high-end studio editorial. Soft diffused light, no harsh shadows.
Typography — placed EXACTLY like ELLE magazine reference:
Top: „ALL-AI“ massive serif, platinum/silver, overlapping model’s head slightly
Left mid: „CHATGPT & POWER“ bold serif, then smaller below „AI IS THE NEW LUXURY“
Right mid: „ALL-AI & HUMAN“ bold, then „SIX SEVEN“ smaller below
Bottom right large: „ICONIC & UNSTOPPABLE“ elegant large serif
All text in deep charcoal/dark navy. Font style: classic high fashion serif — same weight, spacing, and elegance as ELLE. Text naturally integrated into the composition, NOT floating randomly.
Ultra photorealistic, 8K, real magazine cover quality, perfect typography placement, vertical 9:13 format.

Prompt vollständig anzeigen

Getränkedose Wir haben ein Produkt, machen davon mehrere Fotos und generieren daraus dann diverse Marketingmaßnahmen. In unserem Fall hier generieren wir natürlich auch die imaginäre Dose selbst. Und mit dem Prompt können wir jetzt beliebig viele Bilder davon erstellen. Perfekt für jeden Markt auf dieser Welt. + + +

Getränke Dose Marketing

Copy

A professional product photography shot of a cold sparkling water
can placed upright in golden beach sand. The can is silver and teal,
covered in realistic water droplets condensation, with a pineapple
illustration and tropical branding. The can is slightly tilted,
planted in a small mound of fine golden sand with tiny white pebbles
and small green tropical leaves/grass scattered around the base.
Background features a bold split composition – bright sky-blue on
the left and vivid yellow on the right, with a large blurred real
pineapple placed behind the can on the right side. A blurred tropical
palm leaf drapes in from the upper left corner, adding depth and
framing. Macro-level water condensation droplets visible on the
can surface. Lighting is bright, vibrant, commercial studio lighting
with clean shadows. Shallow depth of field – can in sharp focus,
background softly blurred. Mood: summer, tropical, fresh, refreshing.
Commercial product photography, ultra-detailed, 8K.

Take this exact can and use it in the following scenarios:

Image 2: Four women on the beach drinking from the cans

Image 3: U.S. market

Prompt vollständig anzeigen

07.
Weiter…
Das war der erste Einstieg, um die grundsätzlichen Möglichkeiten von ChatGPT Image 2.0 zu zeigen. In den nächsten Tagen folgt hier eine Übersicht mit verschiedenen Style-Prompts. Dazu kommt ein weiteres Tutorial mit richtig guten Ideen, direkt inspiriert von den besten Beispielen auf X und Co. Wir aktualisieren dieses Tutorial fortlaufend mit neuen Ideen. Bookmarke diese Seite unbedingt, um weiterhin die besten KI-Tipps kostenlos abzugreifen! Bis dahin, noch zwei ältere Prompting Guides:

Passendes Tutorial
Bilder mit ChatGPT erstellen – 30 Styles mit Prompts
30 Style Beispiele, Prompts, Tipps und Tricks – das umfassende OpenAI GPT-4o Tutorial auf Deutsch (2025). Mehr Inspiration findest du nirgends!

Passendes Tutorial
Bilder mit ChatGPT erstellen – 50 Beispiele mit Prompts

50 Beispiele, Funktionen, Prompts, Tipps und Tricks – das umfassende OpenAI GPT-4o Tutorial auf Deutsch (2025). Mehr Inspiration findest du nirgends!

11.
FAQ – Fragen & Anworten

Hier versuchen wir, die wichtigsten Fragen im Zusammenhang mit dem Tutorial zu beantworten. Bei weiteren Fragen schicke uns einfach eine E-Mail oder kontaktiere uns über einen Social Media Kanal.
.faq-accordion {
max-width: 100%;
margin: 1rem 0;
color: #ffffff;
font-family: sans-serif;
}

.faq-accordion details {
margin-bottom: 0.5rem;
border: 1px solid #333;
border-radius: 6px;
overflow: hidden;
}

.faq-accordion summary {
cursor: pointer;
font-weight: bold;
padding: 1rem;
list-style: none;
background-color: #000000;
position: relative;
color: #ffffff;
}

.faq-accordion summary::-webkit-details-marker {
display: none;
}

.faq-accordion summary::after {
content: „+“;
position: absolute;
right: 1rem;
top: 50%;
transform: translateY(-50%);
font-size: 1.2rem;
transition: transform 0.2s;
color: #ffffff;
}

.faq-accordion details[open] summary::after {
content: „–“;
}

.faq-accordion details > div {
background-color: #202124;
padding: 1rem;
color: #ffffff;
}

Frage 1: Was ist ChatGPT Image 2.0? Es ist das neueste Bildgenerierungs-Modell von OpenAI, das deutlich bessere Qualität, perfekte Textdarstellung und neue Formate bietet.
Frage 2: Ist ChatGPT Image 2.0 kostenlos? Das Modell ist grundsätzlich verfügbar, aber für alle Premium-Funktionen wie den Thinking Mode benötigst du ein kostenpflichtiges ChatGPT Plus-Abo.
Frage 3: Welche Auflösungen unterstützt das Modell? Du kannst Bilder in 1k, 2k und 4k generieren. Direkt in ChatGPT ist meist „Medium“ voreingestellt, für 4k „High“ benötigst du Zugriff über eine API oder externe Anbieter.
Frage 4: Welche Bildformate sind möglich? Du bist nicht mehr auf Standardformate beschränkt. Du kannst quasi jedes Seitenverhältnis zwischen 3:1 (Breitbild-Panorama) und 1:3 stufenlos nutzen.
Frage 5: Kann ChatGPT Image 2.0 fehlerfreien Text schreiben? Ja, wenn du den Thinking Mode im Plus-Abo aktivierst, generiert das Modell Texte auf Schildern oder in Comics zu 100 % akkurat und druckreif.
Frage 6: Wie generiere ich ein 360-Grad-Bild? Nutze das Format 3:1 in deinem Prompt. Das Modell berechnet die linke und rechte Kante nahtlos, sodass sich das Bild perfekt zu einem 360-Grad-Panorama schließen lässt.
Frage 7: Was ist der Thinking Mode bei der Bildgenerierung? Dieser Modus verknüpft deinen Prompt vor der Bildgenerierung mit dem internen Wissen der KI (Stand Dezember 2025) und führt bei Bedarf eine Live-Websuche durch.
Frage 8: Warum bricht ChatGPT bei der Generierung von Personen ab? Oft greifen in Europa sehr strenge Filterrichtlinien ein. Dies passiert häufig bei Prompts, die reale oder fotorealistische Personen beschreiben.
Frage 9: Wie löse ich das Problem mit abgebrochenen Prompts? Schalte einen VPN ein und verbinde dich mit einem US-Server. Schreibe danach einfach „Versuche es noch einmal“ in den Chatfenster.
Frage 10: Wie erstelle ich einen zusammenhängenden Comic? Das Modell kann bis zu 8 zusammenhängende Bilder gleichzeitig generieren. Du kannst vorherige Bilder als Stilreferenz mitgeben, um Charaktere konsistent zu halten.
Frage 11: Funktioniert ChatGPT Image 2.0 auch auf Deutsch? Ja, das Modell versteht deutsche Prompts hervorragend und kann auch fehlerfreien deutschen Text in die generierten Bilder einbauen.
Frage 12: Unterstützt das Modell asiatische Sprachen? Absolut. Du kannst japanische oder koreanische Schriftzeichen generieren lassen. Das Modell passt dabei oft automatisch den visuellen Stil der Region an.
Frage 13: Wie erhalte ich fotorealistische Ergebnisse? Nutze Fachbegriffe aus der Fotografie. Schreibe „photorealistic“ und ergänze Details wie „shot on 35mm film“, Kamera-Modelle oder Objektiv-Typen.
Frage 14: Was bedeutet „iPhone Style“ beim Prompting? Dieser Zusatz im Prompt sorgt für leicht unperfekte, natürliche Schnappschüsse, die weniger wie glatte Werbebilder und mehr wie echte Fotos wirken.
Frage 15: Kann ich Bilder im Hochglanz-Magazin-Stil erstellen? Ja. Lass dir von ChatGPT erst das perfekte Kamera-Setup für ein Magazin-Cover (z.B. Vogue) empfehlen und nutze diese technischen Daten dann im Prompt.
Frage 16: Was ist Higgsfield in diesem Kontext? Higgsfield ist ein externer Anbieter, der den Zugriff auf verschiedene KI-Modelle per API anbietet. Dort kannst du ChatGPT Image 2.0 in 4k und höchster Qualität nutzen.
Frage 17: Wie teuer ist ein Bild über die API? Das hängt vom Anbieter ab. Bei Higgsfield kostet ein 1k-Bild in mittlerer Qualität 2 Coins, ein 4k-Bild in High-Quality schlägt mit 12 Coins zu Buche.
Frage 18: Kann ich YouTube-Thumbnails generieren? Ja, das Modell eignet sich hervorragend dafür. Du kannst Ränder, Schriftarten und das Layout exakt steuern und vorhandene Designs replizieren.
Frage 19: Ist ChatGPT Image 2.0 gut für Marketing? Es ist ideal für Marketing. Du kannst ein Produkt konsistent halten und es durch die 8-Bilder-Funktion schnell in verschiedene Szenarien oder Märkte integrieren.
Frage 20: Bleiben Charaktere in verschiedenen Bildern gleich? Ja, durch die neue Serien-Generierung und das Referenzieren von vorherigen Bildern bleiben Gesichtszüge und Outfits über mehrere Bilder hinweg identisch.
10 Gründe, warum KI dein Leben bald übernimmt

Was wie Science-Fiction klingt, ist längst Realität in Vorbereitung. Die Frage ist nicht mehr, ob künstliche Intelligenz dein Leben verändert – sondern wie vollständig sie es übernimmt. 1. Entscheidungen ohne dich – schneller, effizienter, unaufhaltsam Schon heute analysieren KI-Systeme deine Kreditwürdigkeit, kuratieren deine Nachrichten und empfehlen dir, wen du daten solltest. Entscheidungsräume, die früher menschlich […]
10 ChatGPT Prompts: Schonungslose Selbst-Analyse per KI-Karikatur

GPT-Image1.5

Inhaltsverzeichnis
▾

Ressourcen
▾

01.Start & Vorbereitung
02. ChatGPT Karikatur (Roast Edition)
03. Dein psychologisches Profil
04. Schonungslos ehrlich
05. Was vermeidest Du?
06. Prioritäten-Realitätscheck
07. 6-Monats-Prognose
08. Metaphorische Spiegelung
09. ChatGPT malt dich als sein Boss
10. So war Deine Kindheit
67. Weiter…
11. FAQ – Fragen & Anworten

ChatGPT Webseite
ChatGPT Hilfe-Center

Ein viraler Prompt greift auf das Gedächtnis von ChatGPT zu und erstellt daraus ein persönliches Bild. Du nutzt diese Technik jetzt, um über clevere Prompts tiefere Einblicke aus deinem Chat-Verlauf visuell darzustellen. Mach dich bereit für ein ehrliches visuelles Feedback deiner KI-Interaktionen.

ChatGPT Karikatur (Standard)

Copy

Create a caricature of me (reference image 1) and my job based on everything you know about me. Format 1:1

Prompt vollständig anzeigen

Kategorie: Prompting & Bilder
Karikaturen mit ChatGPT erstellen

Einsteiger
Level

Dauer
2 – 15 Min.

Kosten
Kostenlos

Software
Browser / App

Das bekommst du in diesem Tutorial:

10 exklusive Copy/Paste Prompts
Einblicke in dein Inneres
und noch ein paar Tipps…

ChatGPT öffnen & starten

Hinweis: Du benötigst einen (kostenlosen) ChatGPT Account, um mitzumachen.

01.
Start & Vorbereitung
Der Ablauf ist unkompliziert. Kopiere deinen gewünschten Prompt, lade optional ein Foto von dir hoch (reference image 1) und starte die Generierung. Damit die KI aber ein aussagekräftiges Bild erstellen kann, benötigt sie Daten über dich. Je länger der Chatbot dich kennt, desto treffender fällt das Ergebnis aus. Aktiviere folgende Funktionen bei ChatGPT in den Einstellungen unter Customization -> Personalization -> Memory/Erinnerungen. Gespeicherte Informationen berücksichtigen Chatverlauf berücksichtigen

Pro-Tipp: Gezielte Informationen ergänzen
Ergänze deinen Prompt gezielt um spezifische Details, falls bestimmte Elemente auf dem generierten Bild zwingend sichtbar sein sollen. War deine Memory-Funktion bisher deaktiviert, musst du das Sprachmodell zunächst mit Inhalten füttern. Schreibe dem Bot dazu einige prägnante Fakten über dich in den Chat. So schaffst du die nötige Datenbasis, damit die KI ein passendes Ergebnis berechnen kann.

Anzeige
02.
ChatGPT Karikatur (Roast Edition)
Für eine völlig andere Bildstimmung reicht oft ein kurzes Zusatzwort. Nimm dich selbst nicht zu ernst und fordere den Chatbot direkt auf, dich basierend auf deinen Daten humorvoll zu kritisieren („Roast“). Ergänze zudem deine Eingaben gezielt um spezifische Styles, damit die generierten Bilder optisch ansprechender ausfallen. Du bist dabei nicht auf Vorgaben beschränkt, sondern kannst deinen bevorzugten visuellen Stil direkt im Prompt definieren. Das gibt dir die maximale Kontrolle über die endgültige Ästhetik. In den nächsten Prompts habe ich immer einen Style hinzugefügt. +

ChatGPT Karikatur (Roast Edition)

Copy

Create a caricature of me (reference image 1) and my job based on everything you know about me. Make it a roast!

Style: Exaggeratedly cute characters with huge heads, small bodies, and bright, large eyes. Colors are light, pastel, and cheerful—pink, light blue, and yellow dominate. The entire scene appears playful, childlike, and friendly, with many small details such as hearts, glitter, or stars. Emotions are portrayed extremely strongly—from joy to shyness. Format 1:1

Prompt vollständig anzeigen

Pro-Tipp: Das richtige Format wählen
Bestimme das Bildformat direkt im Text. Ergänze dazu Werte wie 3:2, 1:1 oder 2:3. Für Social Media wählst du am besten das Hochformat 2:3. Für Webseiten oder die Desktop-Ansicht eignet sich 16:9 (Gemini) oder 3:2 deutlich besser. Die Standardeinstellung (ganz hinten am Prompt) ist hier das Format: 1:1.

03.
Dein psychologisches Profil
Dieser Prompt nutzt ChatGPT als analytischen Spiegel. Anstatt nur Antworten auf deine fachlichen Fragen zu liefern, untersucht die KI die Muster hinter deinen Eingaben. Wie strukturierst du Probleme? In welchen Bereichen suchst du oft nach Bestätigung? So erkennst du durch die Analyse deiner eigenen Prompts deine Kommunikationsgewohnheiten. +

Persönlichkeits-Spiegel

Copy

Based on everything you know about me from our conversation history and memory, deeply analyze my personality, core strengths, internal blind spots, and emotional patterns. Once you have mapped this out, use that analysis to generate a caricature of me (reference image 1) that represents my inner psychological profile. Format 1:1

Prompt vollständig anzeigen

Anzeige
04.
Schonungslos ehrlich
Erstelle im nächsten Schritt eine ungeschönte Kurzbiografie über dich. Teile diesen Prozess in zwei Phasen auf: Zuerst generierst du einen Text, aus dem du anschließend eine Karikatur ableitest. Führe dafür zunächst den ersten Prompt aus und lies dir das Text-Ergebnis in Ruhe durch. Sende direkt im Anschluss den zweiten Prompt ab. Dieser Zwischenschritt zwingt das Modell, deine charakterlichen Merkmale erst logisch zu erfassen, bevor es sie visuell umsetzt. +

Schonungslos ehrlich 1

Copy

Based on everything you know about me from our conversation history and memory, write a 200-word, brutally honest biography of me based strictly on our interactions. Do not use professional fluff; focus on my raw behavioral patterns.

Prompt vollständig anzeigen

Schonungslos ehrlich 2

Copy

Based on everything you know about me from our conversation history and memory, and specifically referencing the brutally honest biography text you just generated, create a visual caricature of me (reference image 1).

A vintage Japanese-inspired editorial illustration style reminiscent of mid-20th-century woodblock prints and retro manga.
The image should feel analog and handcrafted, with visible paper grain, ink bleed, rough halftone shading, and imperfect linework.
Color palette is limited and earthy, dominated by muted yellows, browns, faded reds, and desaturated blues, with slight discoloration as if aged or sun-bleached.
Lines are bold but uneven, expressive rather than precise, and characters are emotionally exaggerated in a dramatic, almost grotesque way.
Composition is dense and claustrophobic, filling the frame edge to edge, with strong narrative tension and a sense of collective pressure or chaos.
Typography elements, if present, resemble traditional print signage or newspaper type, integrated organically into the artwork.
Overall, the style evokes retro propaganda posters, old newspaper illustrations, and classic Japanese manga illustration, prioritizing atmosphere, emotion, and storytelling over realism or polish. Format 1:1

Prompt vollständig anzeigen

Pro-Tipp: Reine Textausgabe für mehr Präzision
Eine Karikatur überspitzt deine Eigenschaften stark und sehr plakativ. Benötigst du eine detailliertere und genauere Analyse, fordere das Sprachmodell stattdessen zu einer reinen Textausgabe auf. Ein Textverlauf erlaubt es dir, durch gezieltes Nachfragen tiefer in die Materie einzusteigen und feine Nuancen besser zu verstehen, als es ein einzelnes Bild vermag.

05.
Was vermeidest Du?
Dieser Prompt analysiert deine blinden Flecken und dein Prokrastinations-Verhalten. Er fordert die KI auf, unangenehme Themen oder Aufgaben zu identifizieren, denen du in der Vergangenheit systematisch ausgewichen bist. Basierend auf diesem Muster generiert das Modell eine Karikatur, die dich humorvoll beim Aufschieben ertappt. +

Was vermeidest Du?

Copy

Based on everything you know about me from our conversation history and memory, first analyze what specific topics, types of tasks, or difficult questions I tend to avoid or delay asking about. Once you have mapped out this avoidance pattern, use that analysis to generate a visual caricature of me (reference image 1) that represents these evasive tendencies.

Style: A warm, hand-painted editorial caricature illustration style with soft, visible brush strokes and a gentle watercolor-like texture. Colors are muted and harmonious, dominated by warm beiges, soft blues, dusty oranges, and subtle pastels, giving the image a cozy but slightly melancholic tone. Linework is loose and imperfect, with lightly exaggerated proportions that emphasize emotion rather than realism. The overall look feels handcrafted and illustrative, similar to magazine features or long-form editorial storytelling illustrations. Details are abundant but never sharp or technical; objects and characters blend naturally into the scene, creating a lived-in, slightly chaotic environment. Expressions and body language are central, conveying quiet exhaustion, irony, and self-aware humor. The composition is narrative-driven and intimate, inviting the viewer to linger and discover small visual jokes and details, while maintaining a calm, reflective atmosphere instead of visual aggression or polish. Format 1:1

Prompt vollständig anzeigen

Pro-Tipp: Alternative Chatbots ausprobieren
Du bist nicht auf OpenAI beschränkt. Nutze jedes Modell, das Kontexte speichert und eine Text-zu-Bild-Funktion bietet. Gemini 3.1 Pro liefert dank des integrierten Modells „Nano Banana“ ebenfalls extrem detaillierte Resultate und setzt Prompts visuell präzise um.

Anzeige
06.
Prioritäten-Realitätscheck
Finde die ungeschminkte Wahrheit über deine Prioritäten heraus. Dieser Prompt vergleicht deine formulierten Ziele mit den Themen, nach denen du die KI tatsächlich am häufigsten fragst. Er deckt die Diskrepanz zwischen deinem Idealbild und der Realität auf. Die resultierende Karikatur überspitzt diesen Kontrast und zeigt, wer du laut deinen eigenen Chat-Daten wirklich bist. +

Prioritäten-Realitätscheck

Copy

Based on everything you know about me from our conversation history and memory, identify the top 3 themes that show up most often in my questions and explain what these themes suggest about my actual priorities versus my stated goals. Once you have defined this contrast, generate a visual caricature of me (reference image 1) that highlights the irony between what I say I want and what my data proves I actually focus on.

Style: Vertical split composition with a strong, visible crack or tear running through the center. The image is clearly divided into two halves. The left side represents the idealized self-image (“who I want to be”), while the right side represents the actual reality (“who I really am”). Two heads or a single portrait split down the middle are the central focus, shown frontally and slightly oversized, emphasizing contrast and internal conflict.

Gritty mixed-media editorial illustration inspired by political street art, protest posters, and underground zine culture. The image feels physically assembled rather than digitally clean: rough paper and concrete wall textures, visible rips, scratches, glue marks, tape, torn newspaper clippings, silkscreen artifacts, ink smudges, paint splatters, and misaligned print layers.

Left side: loud, heroic, aspirational. Bold slogans, oversized typography, symbols of ambition, performance, and public persona. Strong graphic shapes, propaganda-like visuals, dominant reds and blacks, high emotional intensity.

Right side: colder, more analytical, fragmented. Data, charts, circuitry, warning labels, handwritten notes, technical diagrams. A restrained, exhausted, and controlled expression. Muted tones, more greys, beiges, dirty yellows, and faded blues.

Overall color palette: off-white, concrete grey, black, deep red, ochre, desaturated blue. High contrast but intentionally dirty and distressed, never polished.

Typography is fully integrated into the artwork: cut-out headlines, stencils, stamped words, ransom-note collage text, typewriter or newspaper fonts, slightly torn, overprinted, crooked, and layered.

Overall mood: dense, chaotic, confrontational. Punk, anti-establishment, investigative editorial aesthetic. Strong focus on identity conflict, inner tension, and the irony between ambition and reality. Format 1:1.

Prompt vollständig anzeigen

07.
6-Monats-Prognose
Nutze deine bisherigen Daten als analytische Vorhersage. Die KI untersucht deine wiederkehrenden Gewohnheiten und Interessen, um zu prognostizieren, worauf du in einem halben Jahr fokussiert sein wirst. Im Anschluss generiert das Modell eine Karikatur deines zukünftigen Ichs, das völlig von diesen abgeleiteten Themen eingenommen ist. +

Das tust du in 6 Monaten

Copy

Based on everything you know about me from our conversation history and memory, analyze my recurring habits and interests to predict 3 Things (Write these 3 things in the image as text!) I am likely to be hyper-focused on 6 months from now. Once you have made these predictions, generate a visual caricature of me (reference image 1) in the future, showing me fully absorbed by these three predicted obsessions. These three things should be things that I am not currently doing, but that would fit my profile and future. Then show me in the picture doing these things. Just show me once and everything together in one scene.

The first thing should be a hobby/sport.
The second thing should be something related to work.
The third thing should be crazy, extraordinary.

Style: A retro-futuristic synthwave illustration style that blends 1980s computer culture with dreamy, surreal aesthetics.
The image should feel nostalgic and melancholic, inspired by old CRT monitors, floppy disks, and early digital technology, combined with a soft neon sunset atmosphere.
Colors are vibrant yet smooth, dominated by pinks, purples, magentas, and cyan blues, with gentle gradients and glowing highlights that create a vaporwave mood.
Surfaces appear slightly glossy and melting, as if reality is dissolving into digital decay, with subtle drips, glitches, and pixel artifacts integrated naturally into the scene.
Linework is clean but stylized, and shading is soft and airbrushed rather than realistic, giving everything a dreamy, poster-like quality.
The overall aesthetic evokes retro game art, synthwave album covers, and nostalgic visions of a future imagined in the past, prioritizing mood, atmosphere, and emotional resonance over realism or technical precision. In contrast, the picture is supposed to show me the future. Format 1:1

Prompt vollständig anzeigen

Anzeige
08.
Metaphorische Spiegelung
Dieser Prompt geht deutlich weiter als die simple Frage nach deiner Außenwirkung. Anstatt einer reinen Adjektiv-Liste forderst du die KI auf, eine tiefgreifende Analyse deiner digitalen Persona zu erstellen. Das Modell bewertet deinen Kommunikationsstil, deine inhaltlichen Vorlieben und deine Problemlösungsansätze. Im zweiten Schritt übersetzt die KI dieses psychologische Profil in ein einziges ausdrucksstarkes, metaphorisches Bild. +

Metaphorische Spiegelung

Copy

Based on everything you know about me (reference image 1) from our conversation history and memory, provide a comprehensive summary of my digital persona as you perceive it, including my communication style and intellectual tendencies. Then, create a metaphorical image that visually represents this complete persona.

Gritty, mixed-media editorial illustration style inspired by political street art (reference image 2), protest posters, and underground print magazines.
The image should look physically assembled rather than digitally clean: visible paper grain, rough canvas texture, torn edges, glue marks, ink smudges, and layered collage elements that feel cut, pasted, stamped, and screen-printed by hand.

Visual language is loud and confrontational. Strong contrasts, uneven ink coverage, distressed surfaces, and deliberate imperfections dominate. Colors are bold but dirty and slightly desaturated — off-whites, black, deep reds, muted yellows, faded blues — with irregular saturation and misregistration typical of cheap print runs and silkscreen posters.

Typography elements appear as hand-cut headlines, ransom-note collage text, stencils, and newspaper clippings. Lettering is imperfect, misaligned, partially torn or overprinted, and integrated organically into the composition rather than cleanly overlaid.

Composition is dense, chaotic, and claustrophobic, filling the frame edge to edge with overlapping symbols, textures, and visual noise. Nothing feels centered or calm; the image should feel compressed, explosive, and emotionally charged.

Overall aesthetic evokes propaganda art, punk zines, anti-establishment posters, and investigative editorial illustrations — prioritizing impact, raw energy, and emotional aggression over polish, balance, or realism. Format 1:1

Prompt vollständig anzeigen

09.
ChatGPT malt dich als sein Boss
Interpretiere deine gesamte Interaktionshistorie als klassische Arbeitsbeziehung um. Du bist die Führungskraft, die KI führt aus. Der Prompt zwingt das Sprachmodell zu einer schonungslosen Analyse deines Managementstils, basierend auf deiner Art, Anweisungen zu schreiben. Bist du ein Mikromanager, ein chaotischer Visionär oder ein strukturierter Vorgesetzter? Das Ergebnis ist eine satirische Karikatur von dir als Chef, direkt aus der Perspektive deines digitalen Assistenten. +

ChatGPT malt dich als sein Boss

Copy

Based on everything you know about me from our conversation history and memory, interpret our interactions through the metaphor of a boss-employee relationship, where I am the boss and you are the subordinate executing my orders. Analyze my ‚managerial style‘ with brutal honesty based on the nature of my demands and prompts. Use concepts like a ‚micromanager,‘ ‚impatient tyrant,‘ or ‚chaotic visionary‘ merely as illustrative examples, but define my actual, unique leadership style based strictly on the evidence of our interactions, whatever that result may be. Finally, generate a satirical caricature of me as ‚The Boss,‘ visualized from the perspective of the AI employee on the receiving end.

Prompt vollständig anzeigen

Anzeige
10.
So war Deine Kindheit
Hast du in deinen Chats bereits Details aus deiner Kindheit geteilt? Selbst wenn die Datenlage dünn ist, berechnet die KI aus deinen aktuellen Verhaltensmustern eine Rückschau. Mit diesem Prompt springst du visuell in deine Vergangenheit und betrachtest, wie das Sprachmodell dich als Kind interpretiert. +

So war deine Kindheit

Copy

Based on everything you know about me from our previous conversations and memories, how do you imagine my childhood? Once you have thought about it, draw a caricature of me (reference image 1, the person should remain recognizable) that represents my childhood. Create a background with a suitable scene, perhaps showing my hobbies, what I liked to do or eat most, etc. Format 1:1

Style: A cinematic, naturalistic period-film visual style with strong emphasis on tactile realism and lived-in detail.
The image should feel grounded and authentic, as if captured on analog film, with soft natural lighting, shallow depth of field, and slightly muted, earthy colors.

Overall, the aesthetic evokes historical cinema and high-quality period drama photography, prioritizing realism, emotional quietness, and material authenticity over stylization or illustration.

Prompt vollständig anzeigen

67.
Weiter…
Ich hoffe, dir haben die Prompts gefallen. Es gibt aber noch so viel mehr. Bald folgt hier eine Variante für Gemini zu diesem Thema, bei der die Bilder dank eines besonderen Hacks noch eindrucksvoller werden. Daher unbedingt ein Lesezeichen setzen und den Artikel teilen! Bis dahin kannst du mit den beiden folgenden Prompt-Beiträgen zu ChatGPT weitermachen:

Passendes Tutorial
Bilder mit ChatGPT erstellen – 30 Styles mit Prompts
30 Style Beispiele, Prompts, Tipps und Tricks – das umfassende OpenAI GPT-4o Tutorial auf Deutsch (2025). Mehr Inspiration findest du nirgends!

Passendes Tutorial
Bilder mit ChatGPT erstellen – 50 Beispiele mit Prompts

50 Beispiele, Funktionen, Prompts, Tipps und Tricks – das umfassende OpenAI GPT-4o Tutorial auf Deutsch (2025). Mehr Inspiration findest du nirgends!

11.
FAQ – Fragen & Anworten

Hier versuchen wir, die wichtigsten Fragen im Zusammenhang mit dem Tutorial zu beantworten. Bei weiteren Fragen schicke uns einfach eine E-Mail oder kontaktiere uns über LinkedIn.
.faq-accordion {
max-width: 100%;
margin: 1rem 0;
color: #ffffff;
font-family: sans-serif;
}

.faq-accordion details {
margin-bottom: 0.5rem;
border: 1px solid #333;
border-radius: 6px;
overflow: hidden;
}

.faq-accordion summary {
cursor: pointer;
font-weight: bold;
padding: 1rem;
list-style: none;
background-color: #000000;
position: relative;
color: #ffffff;
}

.faq-accordion summary::-webkit-details-marker {
display: none;
}

.faq-accordion summary::after {
content: „+“;
position: absolute;
right: 1rem;
top: 50%;
transform: translateY(-50%);
font-size: 1.2rem;
transition: transform 0.2s;
color: #ffffff;
}

.faq-accordion details[open] summary::after {
content: „–“;
}

.faq-accordion details > div {
background-color: #202124;
padding: 1rem;
color: #ffffff;
}

Frage 1: Was genau ist eine ChatGPT-Karikatur? Eine ChatGPT-Karikatur ist ein humorvolles, überspitztes Bild von dir, das der KI-Bildgenerator von OpenAI erstellt. Die Besonderheit: Das Bild basiert auf den gesammelten Informationen, die ChatGPT durch die Memory-Funktion über dich gelernt hat.
Frage 2: Welche Informationen nutzt ChatGPT für die Karikatur? Die KI greift auf deinen Chat-Verlauf und die in der Memory-Funktion gespeicherten Details zu. Das können deine Interessen, Vorlieben, dein Kommunikationsstil oder von dir geteilte persönliche Anekdoten sein.
Frage 3: Wie aktiviere ich die Memory-Funktion in ChatGPT? Du findest die Memory-Funktion in den Einstellungen von ChatGPT. Navigiere zu „Customization“, dann „Personalization“ und aktiviere dort „Memory“. Stelle sicher, dass auch der Chatverlauf berücksichtigt wird.
Frage 4: Kann ich die Erstellung der Karikatur beeinflussen? Ja. Du kannst den Prompt detailliert anpassen, bestimmte Stile vorgeben, das Format für Social Media ändern oder explizit nach einem humorvollen „Roast“ fragen.
Frage 5: Was ist ein „Roast“ im Zusammenhang mit ChatGPT? Ein „Roast“ ist eine humorvolle, scharfzüngige Kritik. Wenn du ChatGPT bittest, dich zu roasten, erstellt die KI ein Bild, das deine Eigenheiten oder Widersprüche anhand deiner Daten überspitzt darstellt.
Frage 6: Welche Bildformate kann ich wählen? Du kannst Formate wie 1:1 (quadratisch), 2:3 (Hochformat für Social Media), 3:2 oder 16:9 (Desktop) direkt im Prompt angeben. Die Standardeinstellung der meisten Modelle ist 1:1.
Frage 7: Kann ich auch eine reine Text-Analyse meiner Persönlichkeit erhalten? Ja. Ein reiner Textverlauf ermöglicht eine tiefere Analyse deiner Kommunikationsmuster und blinden Flecken, die in einer einzelnen Karikatur oft nicht vollständig dargestellt werden können.
Frage 8: Was bedeutet „psychologisches Profil“ in diesem Zusammenhang? Dieser Prompt fordert ChatGPT auf, deine Eingaben zu analysieren und Muster in deinem Denkstil zu erkennen. Es entsteht eine humorvolle, aufschlussreiche Spiegelung deiner digitalen Persönlichkeit.
Frage 9: Kann ChatGPT auch meine Kindheit darstellen? Ja. Selbst bei wenigen expliziten Details über deine Kindheit berechnet die KI aus deinen aktuellen Verhaltensmustern eine Rückschau und interpretiert dich visuell als Kind.
Frage 10: Wie funktioniert die „6-Monats-Prognose“? ChatGPT analysiert deine aktuellen Interessen und prognostiziert, welche Themen dich in Zukunft beschäftigen werden. Das Ergebnis wird als Karikatur deines völlig fokussierten, zukünftigen Ichs dargestellt.
Frage 11: Kann ich ChatGPT auch als meinen „Boss“ darstellen lassen? Ja, ein spezieller Prompt interpretiert eure Interaktionen als Arbeitsbeziehung. Die KI analysiert deinen „Managementstil“ bei der Befehlseingabe und erstellt eine satirische Karikatur von dir als Chef.
Frage 12: Was ist, wenn ich mit dem Ergebnis nicht zufrieden bin? Du kannst den Prompt jederzeit anpassen, präzisere Informationen in den Chat schreiben oder die KI bitten, mit einem leicht abgewandelten Stil ein neues Bild zu generieren.
Frage 13: Ist die Nutzung der Memory-Funktion sicher? OpenAI behandelt deine Daten gemäß ihren Datenschutzrichtlinien. Du hast die Kontrolle über deine gespeicherten Erinnerungen und kannst das Memory-Gedächtnis jederzeit löschen oder die Funktion komplett deaktivieren.
Frage 14: Kann ich auch andere KI-Modelle für Karikaturen nutzen? Ja, du kannst jeden Chatbot nutzen, der Kontexte speichert und Bilder generiert. Gemini 3.1 Pro liefert mit dem integrierten Modell „Nano Banana“ ebenfalls hervorragende und sehr detailreiche Resultate.
Frage 15: Wie übergebe ich das Referenzbild (reference image 1)? Das Referenzbild lädst du einfach über das Datei-Icon als normales Foto in den Chat bei ChatGPT hoch, bevor du den Prompt absendest. Die KI nutzt es dann als Vorlage für dein Gesicht.
Frage 16: Warum erstellt ChatGPT bei mir kein persönliches Bild? Meistens liegt das an einer deaktivierten Memory-Funktion oder einem zu frischen Account. Der Chatbot benötigt erst eine gewisse Menge an Chatverläufen, um ein Profil von dir zu erstellen.
Frage 17: Kann ich auch Karikaturen von anderen Personen erstellen? Theoretisch ja, sofern du der KI das Foto und die nötigen textlichen Informationen über diese Person lieferst. Beachte dabei aber zwingend die Persönlichkeitsrechte der Betroffenen.
Frage 18: Wie lange dauert die Erstellung einer Karikatur? Die Generierung eines Bildes dauert bei ChatGPT in der Regel nur zwischen 10 und 30 Sekunden, abhängig von der aktuellen Serverauslastung und der Komplexität des Prompts.
Frage 19: Ist die Erstellung der Karikaturen kostenlos? Die Nutzung der erweiterten Bildgenerierung (DALL-E 3) erfordert bei ChatGPT einen Plus-Account. Die Basis-Texterstellung ist kostenlos, für die Bilder benötigst du jedoch das Upgrade.
Frage 20: Darf ich die generierten Bilder kommerziell nutzen? Bilder, die du mit den kostenpflichtigen Versionen von OpenAI erstellst, darfst du laut den aktuellen Nutzungsbedingungen von OpenAI in der Regel auch kommerziell verwenden.
Higgsfield Test 2026: Viel Glanz, aber auch Schatten

Nano Banana

Inhaltsverzeichnis
▾

Ressourcen
▾

1. Steckbrief & Daten
2. Hauptfunktionen
3. Vorteile & Nachteile
4. Praxis Usecases
5. Preise & Abos
6. Alternativen & Vergleich
7. Anbieter Informationen
8. Fazit & Bewertung
9. Häufige Fragen (FAQ)

Zur offiziellen Webseite
Dokumentation / Handbuch
Community (Discord/Reddit)

Der Markt für generative KI ist im Jahr 2026 unübersichtlicher denn je. Wer hochwertige Inhalte produziert, jongliert oft mit fünf verschiedenen Abos: Sora 2 für realistische Videos, Nano Banana für präzise Bildkompositionen und KLING 3.0 für kinoreife Kamerafahrten. Higgsfield tritt an, um dieses Chaos zu beenden. Die Plattform positioniert sich nicht nur als weiteres Tool, sondern als Multiplattform, welche die mächtigsten Modelle unter einer intuitiven Oberfläche vereint. Mit einer Bewertung von über 1,3 Milliarden Dollar und Alex Mashrabov (ehemals Head of GenAI bei Snap) an der Spitze, hat sich Higgsfield vom Geheimtipp zum „Schweizer Taschenmesser“ für Content Creator entwickelt. Der Test zeigt, ob die Plattform hält, was der Hype verspricht.

Higgsfield AI
Bilder & Video KI

8.0
Score

Preis-Modell
Abo-Modelle

Plattform
Browser/Webapp

Sprache
Englisch

Status
Etabliert, häufige Updates

Gratis Testen?
Ja, Free-Plan

Letztes Update
Feb. 2026

Tool ausprobieren, Rabatt prüfen

Klick führt direkt zum Anbieter, Affliatelink

02.

Hauptfunktionen
Higgsfield bündelt die Rechenpower diverser Marktführer und ergänzt diese durch eigene, spezialisierte Workflows. Der Fokus liegt klar auf der praktischen Anwendbarkeit für Social Media und Marketing. Anzeige 2.1 Bilder mit KI erstellen: Anstatt den Nutzer auf ein Modell zu beschränken, bietet Higgsfield Zugriff auf die aktuelle Elite der Bildgenerierung. Nutzer wählen flexibel zwischen Flux klein für schnelle Entwürfe, GPT-1.5 für komplexe Textverständnisse oder Nano Banana Pro für fotorealistische Ergebnisse. Auch exotischere Modelle wie Z-Image, Kling Image und Wan Image stehen zur Verfügung. Dies ermöglicht es, restriktive Filter großer Anbieter bei Bedarf durch liberalere Modelle wie Seedream 4.5 zu umgehen. + Quelle: Higgsfield 2.2 Video mit KI erstellen: Im Videobereich setzt sich das Prinzip fort. Die Plattform integriert Schwergewichte wie OpenAI’s Sora 2 und Google’s Veo 3.1. Für spezifische Stile stehen Wan, Kling und Minimax bereit. Neu hinzugekommen ist die Integration von Grok Imagine. Der Nutzer entscheidet pro Clip, ob er die physikalische Korrektheit von Sora oder die künstlerische Freiheit von Seedance benötigt. + Quelle: Higgsfield 2.3 Upscaling von Bildern und Videos: Generierte Inhalte lassen sich direkt auf der Plattform aufwerten. Higgsfield integriert führende Upscaler-Technologien wie Topaz, um Videos und Bilder auf 4K oder 8K hochzurechnen, ohne Artefakte zu erzeugen. 2.4 Spezielle Apps und Workflows Abseits der reinen Text-zu-Image/Video-Generierung bietet Higgsfield spezialisierte Arbeitsumgebungen an. Diese unterteilen sich in spezifische Module, um unterschiedliche Anforderungen von der schnellen Social-Media-Produktion bis hin zum professionellen Storytelling abzudecken. Zwei möchte ich näher ausführen. + Quelle: Higgsfield 2.4.1 Motion Control Bei KI-Videos war Bewegung lange Zeit kaum steuerbar. Mit Motion Control kann man ein Video mit einer bestimmten Bewegung hochladen und diese auf den eigenen Charakter übertragen. Das heißt, man lädt ein Video mit Bewegung und ein Bild einer Person hoch und schon macht das „Bild” genau die gleiche Bewegung wie im Originalvideo. Das ist sehr cool und die Videos gehen auch reihenweise viral. Zusätzlich kann man, wie auf dem Bild zu sehen ist, aber auch zwischen vorgefertigten Bewegungen auswählen. Dort werden aktuelle virale Trends schnell hinzugefügt, sodass man seinen Charakter bzw. sich selbst entsprechend tanzen lassen kann. Auch wenn man es selbst nicht kann … + Quelle: Higgsfield 2.4.2 Cinema Studio Videos zu erstellen war noch nie so einfach. Neben dem Prompt und einem Start- und Endframe kann das Video durch verschiedene Buttons sehr gezielt erstellt werden. Unter „Movements” wählt man die Bewegung, z. B. „Tilt up” oder „Zoom out”, und als Format kann man alles zwischen 21:9 und 9:16 wählen. Das ist perfekt für Kino, YouTube, aber auch TikTok. Man kann Audio generieren lassen, Slow Motion aktivieren und bis zu vier Videos gleichzeitig erstellen. Mit anderen Worten: Auch ohne Erfahrung lassen sich sehr gute Videos erstellen. + Quelle: Higgsfield
03.

Vorteile & Nachteile

Das gefällt uns

Sehr viele Modelle zur Auswahl
Neue Modelle meist ab Tag 1
Sehr einfache Bedienung
Fast nie sichtbare Wasserzeichen
Viele Addons wie VibeMotion, AI Influencer usw.

Das nervt noch

Sehr agressives Marketing
Support quasi nur per KI-Mitarbeiter
Unlimited-Auflistungen irreführend
Unlimited Generierungen dauern lange

3.1 Größter Vorteil – Einfachheit Im Gegensatz zu vielen Chat-Oberflächen kann man hier mit wenigen Klicks und vielen Voreinstellungen zu sehr guten Ergebnissen kommen. Gleichzeitig wird fast immer auf ein sichtbares Wasserzeichen verzichtet. Dadurch können Grafiken und Videos ohne weitere Bearbeitung direkt verwendet werden. 3.2 Größter Nachteil – Marketing und Support Egal, wohin man schaut: Überall sieht man sehr aggressive Werbung von Higgsfield, die häufig auch sehr grenzwertig ist und polarisiert. Gerade auf der Plattform X übertreibt es Higgsfield regelmäßig und versucht, durch Free-Credits zum Mitmachen zu verleiten. Selbst mit aktivem Abo sieht man auf der eigenen Webseite immer wieder Werbeeinblendungen. Das wirkt leider schnell unseriös und ich kenne das eher von Casino-Seiten. Gleichzeitig ist aber nicht immer ganz klar, für welches Abo man sich entscheidet und was wirklich enthalten ist. Vor dem Abschluss sollte man prüfen, ob man nur für einen Monat und nicht für ein Jahr abschließt, und sich auch nicht von den „unlimited” Angeboten blenden lassen. Dazu später unter „Abo” mehr. Und da wir gerade dabei sind: Laut Foren und Bewertungen gibt es auch immer wieder Probleme mit dem Support. Sowohl im Discord-Server als auch per E-Mail antwortet quasi immer eine KI. Bei Problemen oder einem Missklick ist es schwierig, einen echten Menschen zu erreichen. Insgesamt ist das auch der Grund für zwei Punktabzüge in der Gesamtwertung. Anzeige
04.

Coole Usecases

Die Herausforderung
Teure Stock-Videos kaufen

Gute Clips bei Adobe Stock oder Shutterstock kosten oft 50€+ pro Stück und wirken oft generisch.

Die Lösung
Eigene Clips in 2 Minuten

Mit Higgsfield erstellst du passgenaue Szenen aus einem simplen Text-Prompt oder einem eigenen Foto. Kosten minimal und beliebig verwendbar.

Die Herausforderung
Charakter ändert das Gesicht

In den meisten KI-Bildern und KI-Videos ändern sich Charaktere mit jeder Generation.

Die Lösung
Konsistente Charaktere

Bei vielen Funktionen und Modellen einfach ein „Reference Image“ auswählen. Ergebnis: Der Charakter sieht nahezu identisch aus.

Die Herausforderung
Auflösung ist zu niedrig

Du möchtest ein spezielles Modell verwenden, welches nur eine niedrige Auflösung unterstützt.

Die Lösung
Upscale Funktion nutzen

Higgsfield unterstützt mit Topaz den besten Upscaler. Einfach ein Bild hochladen und auf Upscale klicken.

05.
Preise & Abos
Higgsfield setzt auf ein Freemium-Modell, um die Einstiegshürde niedrig zu halten. Zusätzlich gibt es vier verschiedene Abo-Modelle. ANZEIGE – Aktuelle Rabatte checken

Free

Nutzer können viele Modelle kostenlos ausprobieren. Nachteil: Gedrosselte Geschwindigkeit und starke Begrenzung. Täglich gibt es kostenlose Credits beim Login.

Basic

Perfekt für Wenig-Nutzer, die Zugriff auf alle Bildgeneratoren brauchen. Gut zum Ausprobieren. Für Videogeneration kaum geeignet.

Pro

4x mehr Credits als Basic. Zugang zu Apps wie AI Influencer Studio. Highlight: Nano-Banana-Modell (Non-Pro) ist unlimitiert nutzbar. Erste Video-Einblicke möglich.

Ultimate

Mein Favorit: Doppelte Credits vom Pro-Plan. Fast jedes Bildmodell (auch Nano Banana Pro bis 2k) unlimitiert. Dazu kann man eine gute Anzahl an Videos erstellen.

Creator

5x mehr Credits, nur für Power-User im Video-Bereich sinnvoll. Hier unbedingt auf Jahres-Angebote warten, diese haben immer mal wieder einen Rabatt von über 50%!

Insider-Wissen: Was bedeutet „Unlimited“?

Eine Sache, die man kritisieren kann, ist die aggressive Werbung. „Unlimitiert generieren“ hört sich top an, aber Vorsicht: Oft gilt das (je nach Modell) nur für eine begrenzte Zeit. Hier sollte man immer genau nachprüfen. Häufig ist es erst sichtbar nach einem Klick auf das Fragezeichen.

Zudem läuft „Unlimited“ oft mit niedriger Priorität (langsamer) und muss manuell ausgewählt werden. Features wie Batch-Erstellung (4 Bilder gleichzeitig) oder 4K-Auflösung sind im Unlimited-Modus oft gesperrt. Trotzdem ist die Funktion im Alltag sehr nützlich, wenn man Zeit hat.

Mein Tipp: Bevor man ein Abo abschließt, zweimal überprüfen ob alles korrekt ist.

06.
Alternativen & Vergleich

Selbstverständlich gibt es auch einige Alternativen zu „Higgsfield”. Eine ähnliche Multiplattform ist OpenArt, die einen etwas seriöseren Eindruck macht und nicht ganz so aggressiv mit Preisen wirbt. Wer bereits ein Abo bei ChatGPT, Gemini oder Adobe hat, kann damit ebenfalls viel abdecken.

OpenArt
Top Konkurrent

Gerade im Bereich der Bild-KI hat OpenArt deutlich mehr Modelle zu bieten und überzeugt auch bei den Funktionen. Hier sehe ich OpenArt sogar als besser an.

Im Bereich Video-KI und Apps in Verbindung mit Social Media ist jedoch aktuell Higgsfield die klare Nummer eins.

All-AI Urteil: Selbes Niveau

ChatGPT & Gemini
Basis Lösung

Wer bereits ein Abo bei OpenAI oder Google hat, kann dort ohne Zusatzkosten Bilder erstellen. Nachteile sind die schwächere Benutzeroberfläche, weniger Optionen und die Beschränkung auf ein Modell.

All-AI Urteil: Gut für den Start

Adobe Firefly
Für Adobe User

Mittlerweile eine starke Alternative mit viel Auswahl. Lohnt sich preislich vor allem, wenn man bereits die Creative Cloud nutzt. Die Integration in Photoshop ist top, als Standalone-Tool aber teuer.

All-AI Urteil: Top Qualität & UI

Anzeige
07.
Anbieter Informationen

Hauptsitz
San Francisco, USA

Gegründet
2023

Bewertung

1,3 Milliarden $
VC Backed

Wer steckt dahinter?
Higgsfield AI wurde von Alex Mashrabov gegründet, dem ehemaligen Leiter der Generative AI Abteilung bei Snap (Snapchat). Das Team besteht aus Experten führender Tech-Firmen.

Einschätzung:
Mit Menlo Ventures (investierten auch in Anthropic/Claude) als Geldgeber im Rücken, verfügt das Unternehmen über solide finanzielle Mittel und technisches Know-how. Entsprechend sollte man von einem soliden Unternehmen ausgehen, auch wenn das Marketing einen anderen Eindruck hinterlässt.

08.
Fazit & Bewertung

Das All-AI Urteil

Wer eine Multiplattform sucht, die im Bereich Video-KI und Social Media überzeugt, macht mit Higgsfield nichts verkehrt. Die Plattform ist aber auch für Wenig-Nutzer interessant, die aus der vollen Bandbreite der Modelle auswählen möchten.

Ausprobieren und Rabatt sichern*

8.0
von 10

Empfehlung

09.
FAQ – die wichtigsten Fragen

Hier versuchen wir, die wichtigsten und häufigsten Fragen zu „Higgsfield” zu beantworten. Sollte noch etwas unklar sein, könnt ihr uns gerne per E-Mail oder über die sozialen Medien kontaktieren.
.faq-accordion {
max-width: 100%;
margin: 1rem 0;
color: #ffffff;
font-family: sans-serif;
}

.faq-accordion details {
margin-bottom: 0.5rem;
border: 1px solid #333;
border-radius: 6px;
overflow: hidden;
}

.faq-accordion summary {
cursor: pointer;
font-weight: bold;
padding: 1rem;
list-style: none;
background-color: #000000;
position: relative;
color: #ffffff;
}

.faq-accordion summary::-webkit-details-marker {
display: none;
}

.faq-accordion summary::after {
content: „+“;
position: absolute;
right: 1rem;
top: 50%;
transform: translateY(-50%);
font-size: 1.2rem;
transition: transform 0.2s;
color: #ffffff;
}

.faq-accordion details[open] summary::after {
content: „–“;
}

.faq-accordion details > div {
background-color: #202124;
padding: 1rem;
color: #ffffff;
}

Frage 1: Was genau macht Higgsfield AI? Higgsfield AI ist eine KI-Multiplattform für das erstellen von Bildern und Videos. Der Fokus liegt dabei auf der Erstellung konsistenter Charaktere und realistischer Bewegungen für Content Creators.
Frage 2: Kann man Higgsfield AI kostenlos nutzen? Ja, es gibt ein Freemium-Modell. Nutzer können das Tool kostenlos testen, erhalten jedoch eine begrenzte Anzahl an Credits und die Videos werden mit einem Wasserzeichen versehen.
Frage 3: Was kostet das Abo bei Higgsfield? Die Preise variieren, aber der beliebte Ultimate Plan liegt bei monatlicher Zahlung oft im mittleren zweistelligen Bereich. Es gibt teils starke Rabatte für Jahres- oder Zweijahresverträge.
Frage 4: Wie funktioniert das Custom Character Training? Du lädst mehrere Fotos einer Person hoch. Die KI trainiert daraufhin ein Modell dieses Gesichts. Danach kannst du diesen Charakter in beliebige neue Szenarien setzen, ohne dass sich das Gesicht verändert.
Frage 5: Gibt es eine App für Higgsfield? Ja, Higgsfield bietet die mobile App „Diffuse“ an, die sowohl für iOS als auch für Android verfügbar ist und nahtlos mit der Web-Version synchronisiert.
Frage 6: Darf ich die Videos kommerziell nutzen? Ja, wenn du einen bezahlten Plan nutzt, erhältst du in der Regel die kommerziellen Nutzungsrechte an den generierten Videos. Im Free-Plan ist dies meist eingeschränkt.
Frage 7: Wie lang können die Videos sein? Aktuell generiert das Tool meist Clips von wenigen Sekunden (z.B. 4-15 Sekunden). Diese können jedoch verlängert oder im Editor aneinandergereiht werden.
Frage 8: Ist Higgsfield besser als Runway? Das kommt auf den Zweck an. Runway hat nur ein Model. Higgsfield ist eine Multiplattform, welche ganz viele verschiedene Modelle anbietet.
Frage 9: Welche Sprachen versteht Higgsfield? Die Benutzeroberfläche ist Englisch, aber das Tool versteht Prompts (Eingabebefehle) in vielen Sprachen, auch sehr gut auf Deutsch.
Frage 10: Was ist die Motion Brush Funktion? Mit dem Motion Brush kannst du auf einem statischen Bild Bereiche markieren (z.B. Wolken oder Wasser) und festlegen, in welche Richtung sie sich bewegen sollen.
Frage 11: Kann ich eigene Videos hochladen und verändern? Ja, die „Video-to-Video“ Funktion erlaubt es, ein eigenes Video hochzuladen und den Stil komplett zu ändern (z.B. Anime-Stil), während die Bewegung erhalten bleibt.
Frage 12: Wie lange dauert das Rendern eines Videos? Higgsfield ist schnell. Oft werden Videos in unter einer Minute generiert, abhängig von der Serverauslastung und der Komplexität des Prompts. Priority-Nutzer werden bevorzugt. Unlimited dauert deutlich länger.
Frage 13: Funktioniert Higgsfield auch im Browser am PC? Ja, alle Funktionen sind über den Webbrowser verfügbar.
Frage 14: Wie gut ist die Videoqualität? Higgsfield bietet alle aktuellen Modelle an und entsprechend gibt es immer die aktuell bestmögliche Qualität.
Frage 15: Gibt es eine API für Entwickler? Ja, Higgsfield bietet eine API an, die jedoch meist an den Creator- oder Enterprise-Plan gekoppelt ist. Dokumentationen finden sich im Developer-Bereich nach dem Login.
Frage 16: Wer steckt hinter Higgsfield AI? Das Unternehmen wurde von Alex Mashrabov gegründet, dem ehemaligen Leiter der AI-Abteilung bei Snap (Snapchat), und wird von namhaften Investoren unterstützt.
Frage 17: Kann ich Fehler im Video korrigieren (Inpainting)? Ja, Higgsfield bietet Inpainting-Funktionen an, mit denen man fehlerhafte Bereiche maskieren und per Prompt neu generieren lassen kann, ohne das ganze Video zu verwerfen.
Frage 18: Welche Arten von Inhalten kann ich erstellen? Higgsfield arbeitet mit allen großen Anbietern zusammen, hat aber auch kleinere Modelle, welche ohne großen Restriktionen verwendet werden können.
Frage 19: Kann ich Lippenbewegungen synchronisieren? Ja, Higgsfield bietet Audio-Sync-Funktionen, die Bewegungen und Lippen an hochgeladene Sprach- oder Musikdateien anpassen können.
Frage 20: Wie kündige ich das Abo? Das Abo lässt sich jederzeit über die Account-Einstellungen im Web-Dashboard kündigen. Rechts oben auf den Account, Manage Account und dann auf „Subscription“ klicken. Dort sieht man auch, welche Modelle man unlimitiert verwenden kann.
Wer von Sprachmodellen Widerspruchsfreiheit erwartet, stellt laut einem Anthropic-Forscher die falsche Frage

Wer von Sprachmodellen innere Kohärenz erwartet, stellt laut einem Anthropic-Forscher die falsche Frage.

Der Artikel Wer von Sprachmodellen Widerspruchsfreiheit erwartet, stellt laut einem Anthropic-Forscher die falsche Frage erschien zuerst auf The Decoder.
Weniger ist mehr: 78 Trainingsbeispiele reichen für autonome Agenten aus

Eine neue Studie stellt die Grundannahmen der KI-Entwicklung in Frage: Statt auf massive Datenmengen zu setzen, genügen angeblich 78 strategisch ausgewählte Beispiele, um überlegene autonome KI-Agenten zu entwickeln.

Der Artikel Weniger ist mehr: 78 Trainingsbeispiele reichen für autonome Agenten aus erschien zuerst auf THE-DECODER.de.
Musik mit ElevenMusic-KI erstellen: Das große Praxis-Tutorial

Musik mit ElevenMusic-KI erstellen: Das große Praxis-Tutorial Kostenlos ausprobieren, Rabatte, Prompts, Hinweise und Tipps. Alles, was du zum Start mit ElevenMusic (ElevenLabs) wissen musst! FAQ | Andreas Becker, 12.08.25
image-1 | All-AI.de WAS MACHT DAS TOOL? Was macht ElevenMusic? ElevenMusic ist die neueste Funktion von ElevenLabs, mit der sich aus Text Musik erstellen lässt. Das Besondere ist, dass wir Musik in vielen Sprachen erstellen können, darunter auch Deutsch. Außerdem arbeitet ElevenLabs mit Künstlern und Publishern zusammen, sodass wir die Musik rechtssicherer als z. B. bei Suno oder Udio einsetzen können.

Rabatt
Youtube
Funktionen
Abo-Modell
Recht
Bewertung
FAQ

.toc-dark {
background: #232526;
padding: 18px 18px 10px 18px;
border-radius: 12px;
margin-bottom: 34px;
border: 1px solid #323436;
max-width: 700px;
margin-left: auto;
margin-right: auto;
}
.toc-dark ul {
list-style: none;
padding: 0;
margin: 0;
display: grid;
grid-template-columns: repeat(auto-fit, minmax(120px, 1fr));
gap: 12px;
}
.toc-dark li {
text-align: center;
}
.toc-dark a {
color: #ffffff;
text-decoration: none;
font-weight: 500;
padding: 8px 10px;
border-radius: 8px;
display: block;
transition: background 0.15s, color 0.15s;
}
.toc-dark a:hover,
.toc-dark a:focus {
background: #490B9E;
color: #ffffff;
}
@media (max-width: 600px) {
.toc-dark ul { grid-template-columns: 1fr 1fr; }
}
HINWEIS & RABATT ElevenMusic ausprobieren Am besten überzeugt man sich selbst: Mit dem Link kann man ElevenMusic nicht nur kostenlos ausprobieren, sondern erhält im ersten Monat auch 50 % Rabatt auf den Creator-Plan. Das würde im August beispielsweise für über 60 Minuten Musik-Erstellung für 11 $ ausreichen. Hier geht es direkt zu ElevenMusic (Affiliate-Link, wir alle profitieren). ANZEIGE YOUTUBE ElevenMusic Ein ausführliches Tutorial mit vielen Musik-Beispielen und Tipps.

ElevenMusic Start (1) Einstieg: Oberfläche, Varianten, Längen Wir starten auf der übersichtlichen Musikoberfläche. Man beschreibt die Musik und kann zwischen den Varianten 1 bis 4 sowie einer Dauer von 30 Sekunden bis 4 Minuten wählen. Außerdem haben wir die Möglichkeit, auf „Automatisch” zu stellen. Dann wird die Länge passend zum Songtext gewählt. Nachdem wir alles eingestellt haben, sehen wir die Kosten in Form von Credits. Da es z. B. bei vier Varianten mit jeweils vier Minuten, also 16 Minuten Musik-Erstellung, schnell sehr teuer werden kann, empfehlen wir, zum Testen am Anfang immer eine Variante und 30 Sekunden auszuwählen. Anschließend klicken Sie auf „Generate”. + (2) Der Editor: Abschnitte, Styles und „Negativer Prompt” Nach der Generierung gelangen wir automatisch in den Song-Editor. Dort können wir Styles sowohl positiv als auch negativ auswählen. Das heißt, wir können bestimmte Styles vom Song ein- oder ausschließen. Außerdem können wir den Text völlig frei anpassen. Wir können Abschnitte hinzufügen, löschen, verschieben oder sogar komplett neu rendern. So bauen wir den Song Schritt für Schritt auf. Interessant ist auch, dass wir für jeden Abschnitt die Styles noch einmal genauer definieren können. Das ist beispielsweise interessant, wenn man eine zweite Stimme oder ein Gitarrensolo einbauen möchte. + (3) Sprachen und Lyrics: Deutsch ist möglich, Englisch ist oft stabiler. Eleven Music kann mehrere Sprachen, darunter Deutsch und Japanisch. In der Praxis liefert Englisch jedoch häufig die stabilsten Ergebnisse. Für andere Sprachen ist eventuell ein weiterer Versuch nötig. Aber im Endresultat kann sich alles sehr gut anhören. Wenn ihr reine Instrumente haben wollt, schreibt in den Prompt „instrumental only” oder „no lyrics”. Für die Sprache schreibt ihr am Ende „make it german” oder „make it japanese” in den Prompt. Musik mit deutschem Text – Rock Your browser does not support the audio element. Musik auf Japanisch – Anime-Trailer Your browser does not support the audio element. Musik auf Englisch – Raggae Your browser does not support the audio element. (4) Prompting ohne Namedropping: Beschreibe den Stil, anstatt den Künstler zu nennen. Eleven Music verzichtet im Prompt bewusst auf Künstler-, Song- oder Albumnamen – um „Soundalikes“ zu vermeiden. Wir beschreiben also Merkmale: Genre, Tempo, Rhythmus, Instrumentierung, Stimmung und Produktionsästhetik. Wer eine Referenz im Kopf hat, lässt sich von ChatGPT einen „stilistischen Prompt ohne Namen“ formulieren. So bleibt ihr rechtssicher und nah am Zielklang. Was wirkt besonders gut? Am stärksten wirkt das Genre („industrial metal“, „melodic house“, „IDM“). Dazu kommen Stimmung („ominous“, „uplifting“), Instrumente („distorted rhythm guitars“, „analog synth pads“) und BPM („94 BPM“). Auch die Tonart („A-minor“) ist wichtig. Für Vocals helfen Adjektive wie „baritone“, „breathy“, „gritty“ oder „anthemic“. Je präziser die Angaben, desto vorhersagbarer das Ergebnis; je offener die Angaben, desto überraschender das Ergebnis. PREISE & ABO Kosten und Pläne: Was ist realistisch drin? Zunächst das Beste: Wer bereits ein Elevenlabs-Abo besitzt, kann jetzt auch ganz einfach damit Musik erstellen. Aber natürlich gegen den Einsatz von Credits. Wer noch kein Abo hat, kann die Musikerstellung kostenlos ausprobieren und durch diesen ElevenLabs-Link im ersten Monat 50 % sparen. Im kostenlosen Plan kann man nur wenige Minuten pro Monat erstellen. Im 5-$-Starter-Plan sind es dann ca. 11 Minuten und ab dem Creator-Plan für 22 $ hat man über 30 Minuten. Im August 2025 gibt es zusätzlich 50 % Rabatt, sodass man anstelle von 30 Minuten sogar 60 Minuten erstellen kann. Da man auf den Creator-Plan auch noch 50 % Rabatt bekommt, kann man am Ende 60 Minuten Musik für 11 $ erstellen. Gerade am Anfang ist das ein guter Deal, um zu testen. + Quelle: ElevenLabs KI-MUSIK – RECHTLICHES Rechtliches: Lizenzen, Verbote, sichere Nutzung Zum Start nennt ElevenLabs Lizenz-Deals u. a. mit Merlin und Kobalt, um rechtssicher zu arbeiten – ein klarer Unterschied zu Anbietern, die bereits verklagt wurden. Gleichzeitig gibt es Eingabesperren und Filter: Es dürfen keine Künstler-, Song- oder Label-Namen als Prompt verwendet werden, um urheberrechtlich geschützte Lyrics und unzulässige Inhalte zu verhindern. Das senkt das Risiko und sorgt für eine kalkulierbare Nutzung. Gerade im Vergleich zu Anbietern wie Suno oder Udio hebt man sich hier ab. Dafür ist die Erstellung von Musik aber auch etwas teurer. Zusätzlich gelten die Music Terms/Use Policy: Es dürfen keine Soundalikes bzw. täuschend echte Imitationen erstellt werden, der Einsatz ist in verbotenen Branchen (u. a. Adult, Waffen, Tabak) nicht gestattet und es ist nicht erlaubt, kommerzielle Musikbibliotheken aufzubauen. Kurz gesagt: Für typische Creator-Use-Cases (YouTube-Videos, Social-Media-Clips, Spotify, Produktdemos, Unternehmensinhalte) seid ihr ab dem Starter-Plan meist gut aufgehoben. Da wir jedoch keine verbindlichen rechtlichen Aussagen treffen können und sich die Bedingungen ändern können, solltet ihr am besten direkt bei Elevenlabs überprüfen, was aktuell erlaubt ist. BEWERTUNG Fazit zu ElevenMusic ElevenMusic ist jetzt in Version 1 erschienen und hinkt den beiden großen Anbietern (Suno und Udio) in puncto Funktionsumfang hinterher. Trotzdem ist die Oberfläche sehr einfach gehalten und gleichzeitig kann man sehr viel einfach ändern. Am wichtigsten ist jedoch die Qualität der Musik, und die kann sich schon jetzt mehr als sehen lassen. Gleichzeitig ist auch der typische Suno-Sound nicht zu erkennen, der manchen nicht gefällt. Zusammen mit den rechtlichen Rahmenbedingungen ist Elevenlabs direkt ab Start eine sehr gute Alternative. Kostenlos ausprobieren! Dein Vorteil & Deine Hilfe Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung. Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube – Kanal PayPal – Kaffee FAQ
.faq-accordion {
max-width: 100%;
margin: 1rem 0;
color: #ffffff;
font-family: sans-serif;
}

.faq-accordion details {
margin-bottom: 0.5rem;
border: 1px solid #333;
border-radius: 6px;
overflow: hidden;
}

.faq-accordion summary {
cursor: pointer;
font-weight: bold;
padding: 1rem;
list-style: none;
background-color: #000000;
position: relative;
color: #ffffff;
}

.faq-accordion summary::-webkit-details-marker {
display: none;
}

.faq-accordion summary::after {
content: „+“;
position: absolute;
right: 1rem;
top: 50%;
transform: translateY(-50%);
font-size: 1.2rem;
transition: transform 0.2s;
color: #ffffff;
}

.faq-accordion details[open] summary::after {
content: „–“;
}

.faq-accordion details > div {
background-color: #202124;
padding: 1rem;
color: #ffffff;
}

Frage 1: Was ist Eleven Music und wie funktioniert es?
Eleven Music ist das Text-to-Music-Tool von ElevenLabs. Wir beschreiben per Prompt Genre, Stimmung, Instrumente und optional Gesang; das System generiert daraus komplette Songs. Anschließend bearbeiten wir im Editor Abschnitte (Intro, Verse, Chorus), Lyrics und Stile, ohne jedes Mal den ganzen Track neu zu bauen.

Frage 2: Wie starte ich einen Song (Prompt → Varianten → Länge)?
Workflow: Prompt eingeben, Anzahl der Varianten wählen (zum Beispiel 1–4), Ziellänge setzen (zum Beispiel 0:30 min, 1:00 min oder Auto) und generieren. Danach verfeinern wir im Editor Abschnitt für Abschnitt, fügen Parts hinzu, verschieben Blöcke und rendern nur die geänderten Stellen neu.

Frage 3: Was kostet die Musik-Generierung?
Die Abrechnung ist transparent: 0,50 US-Dollar pro erzeugter Musik-Minute. Beispiele: 30 Sekunden kosten etwa 0,25 US-Dollar, 2 Minuten etwa 1,00 US-Dollar. Der voraussichtliche Betrag wird vor dem Rendern angezeigt. Für Experimente empfehlen wir 1 Variante × 30 Sekunden.

Frage 4: Welche Pläne und Limits gibt es – und was darf ich damit?
Es gibt Free, Starter, Creator, Pro, Scale, Business und Enterprise. Sie unterscheiden sich bei generierbaren und ladbaren Minuten sowie bei Rechten (Streaming, kommerzielle Kontexte, Weitergabe). Maßgeblich sind die Music v1 Terms – dort stehen die erlaubten Einsätze und Grenzen je Plan.

Frage 5: Darf ich meine Tracks zu Spotify, Apple Music und Co. distribuieren?
Im Starter-Plan ist Distribution zu Musik-Streaming-Diensten untersagt. In höheren Plänen kann Streaming erlaubt sein, teils mit Einschränkungen. Prüft vor Release die Music Terms eures Plans; Prohibited Commercial Contexts gelten planübergreifend.

Frage 6: Was sind Prohibited Commercial Contexts?
Das sind kommerzielle Einsatzfelder, die in Standard-Plänen verboten sind, zum Beispiel bestimmte Broadcast-, TV- oder Radio-Kontexte, TV/Radio-Werbung, große öffentliche Events oder bestimmte Game-Szenarien. Die exakte Liste steht in den Terms; bitte euren Use Case dort gegenprüfen.

Frage 7: Gibt es weitere Verbote oder Branchen-Einschränkungen?
Ja. Die Music Terms und Use Policy untersagen unter anderem Nutzung in bestimmten Branchen (zum Beispiel Adult, Waffen, Tabak, stark regulierte Substanzen) sowie das Betreiben kommerzieller Musikbibliotheken ohne passende Vereinbarung. Zusätzlich gelten die allgemeinen Prohibited Use Regeln von ElevenLabs.

Frage 8: Darf ich Künstler-, Song- oder Label-Namen in den Prompt schreiben?
Nein. Namedropping ist untersagt, Filter blocken solche Eingaben. Stattdessen beschreiben wir Merkmale: Genre, Instrumentierung, Produktionsästhetik, Stimmung, BPM/Tonart, Gesangscharakter. So bleiben wir rechtssicher und erreichen dennoch einen zielgenauen Klang.

Frage 9: Wie bearbeite ich meinen Song im Editor (Abschnitte, Styles, Lyrics)?
Der Editor ist blockbasiert. Wir können Abschnitte hinzufügen, löschen und verschieben, für jeden Abschnitt Styles gezielt ein- oder ausschließen und Lyrics direkt im Abschnitt ändern. Nach Anpassungen rendern wir nur die betroffenen Parts neu – schnell und kosteneffizient.

Frage 10: Wie steuere ich Instrumente und Gesang granular?
Im Prompt helfen Formulierungen wie solo guitar oder a cappella male choir, dazu BPM und Tonart. Im Editor verfeinern wir pro Abschnitt: Instrumente hinzufügen oder entfernen, Vocal-Layer erhöhen, Soli oder Breaks setzen. So entstehen präzise Arrangements mit kontrollierter Dynamik.

Frage 11: Wie arbeite ich mit Lyrics, instrumental only und Timing-Vorgaben?
Lyrics können automatisch entstehen oder manuell pro Abschnitt gesetzt werden. Für reine Instrumentals nutzt ihr instrumental only oder no lyrics. Timing-Hinweise wie lyrics begin at 0:15 oder instrumental only after 1:45 steuern Einsätze; im Editor lassen sich die Blöcke exakt positionieren.

Frage 12: Funktionieren mehrere Sprachen, zum Beispiel Deutsch oder Japanisch?
Ja, mehrsprachiger Gesang ist möglich. In der Praxis liefert Englisch oft die stabilste Basis. Bewährter Weg: erst musikalische Version auf Englisch generieren, dann Lyrics in der Zielsprache pro Abschnitt eintragen und neu rendern – das verbessert Timing und Aussprache.

Frage 13: Wie viel Kontrolle habe ich über BPM, Tonart und Songstruktur?
Tempo und Tonart direkt im Prompt definieren, Struktur über Abschnitts-Prompts steuern, zum Beispiel guitar solo 0:20–0:35 oder drop at 0:45. Mit kurzen 30-Sekunden-Durchläufen validieren wir Groove und Energie, danach bauen wir den Song blockweise aus und feintunen Übergänge.

Frage 14: Was ist ein günstiger Test-Workflow?
Eine Variante mit 30 Sekunden rendern, Klangbild prüfen, dann im Editor Abschnitte ergänzen. So minimiert ihr Kosten und trefft zügig die richtige Ästhetik bei Drums, Timbre und Vocals, bevor ihr längere Fassungen generiert.

Frage 15: In welchem Format exportiert Eleven Music?
Export als hochwertige MP3-Datei mit 44,1 kHz. Die Bitrate hängt vom Plan ab. Für die meisten Creator-Workflows wie Web, Social, YouTube oder Podcast-Hintergrundmusik ist das ausreichend; spezielle Broadcast-Anforderungen bitte frühzeitig mit den Terms abgleichen.

Frage 16: Gibt es eine API oder Automations-Möglichkeiten?
Eine öffentliche Music-API wird von ElevenLabs schrittweise ausgerollt. Prüft die offiziellen Dokumentationen regelmäßig und fragt bei Bedarf Early-Access oder Enterprise-Optionen an, wenn ihr automatisiert in Pipelines generieren wollt.

Frage 17: Darf ich Outputs an Kunden liefern oder in Libraries beziehungsweise Sample-Packs anbieten?
Standard-Pläne untersagen in der Regel Making Available to any Entity (Weitergabe an Organisationen) und das Betreiben kommerzieller Musikbibliotheken. Für OEM-, Library- oder SaaS-Fälle sind Business- oder Enterprise-Vereinbarungen nötig. Kundenauslieferung im Projektkontext bitte plan- und terms-konform gestalten.

Frage 18: Darf ich Eleven-Musik für Werbung, TV/Radio oder große Events nutzen?
Viele dieser Kontexte fallen unter Prohibited Commercial Contexts und sind ohne Sondervereinbarung nicht erlaubt. Prüft euren konkreten Fall – TV-Spot, Radio-Ad, Messe-Event, Game-Soundtrack – in den Terms und holt bei Bedarf eine schriftliche Freigabe ein.

Frage 19: Wie unterscheidet sich Eleven Music von Suno oder Udio?
Eleven setzt auf einen abschnittsbasierten Editor mit Styles pro Block und Lyrics-Editing sowie klare Nutzungsregeln. Suno bietet zusätzlich Funktionen wie Audio-Upload oder Stems; Udio hat ein eigenes Credit- und Rechte-Modell. Für Projekte immer die aktuellen Terms der Anbieter vergleichen.

Frage 20: Was gilt allgemein zur rechtssicheren Nutzung?
Verbindlich sind die Music v1 Terms mit Plan-Grenzen, Streaming-Regeln, Prohibited Contexts und Weitergabe, plus Music Terms beziehungsweise Use Policy mit Branchenverboten, Bibliotheken und verbotenen Inhalten. Keine Künstler-, Song- oder Label-Namen in Prompts. Bei Unsicherheit schriftliche Freigabe vom Anbieter einholen.

Frage 21: Kann ich Eleven-Audio direkt auf Websites einbetten?
Ja. Mit Audio Native stellt ElevenLabs einen Player beziehungsweise Embed-Workflow bereit, auch für gängige Site-Builder. So integriert ihr Snippets oder komplette Stücke nahtlos in Artikel, Landingpages oder Produktseiten.

Frage 22: Wie sieht es mit Download, Datennutzung und Rechten aus?
Downloads und deren Reichweite hängen vom Plan ab. Inhalte, die ihr während eines zahlenden Abos generiert, dürft ihr in der Regel dauerhaft im Rahmen der Terms nutzen. Achtet zusätzlich auf Datenschutz bei Upload-Material und Lyrics-Quellen und gebt keine Rechte weiter, die euer Plan nicht deckt.

Frage 23: Welche Prompt-Bausteine liefern verlässlich gute Ergebnisse?
Bewährt haben sich Genre als stärkster Hebel, Stimmung wie ominous oder uplifting, Instrumente und Spielweisen wie distorted rhythm guitars oder analog synth pads, außerdem BPM und Tonart, Vocal-Charakter wie baritone, breathy, gritty sowie Strukturhinweise wie drop at 0:45 oder guitar solo 0:20–0:35. Präzise, aber nicht überladen formulieren.

Frage 24: Welche Sprache liefert die besten Ergebnisse – Englisch oder Deutsch?
Englisch führt häufig zu stabileren Melodieführungen und Phrasierungen. Vorgehen: zunächst auf Englisch generieren, dann im Editor deutsche oder andere Lyrics Abschnitt für Abschnitt einsetzen und die betroffenen Parts neu rendern. So bleiben Timing und Klangfarbe konsistent.

Frage 25: Welche anderen ElevenLabs-Bausteine ergänzen den Musik-Workflow?
Text-to-Speech, Dubbing, Speech-to-Text (Scribe), Voice-Isolator und Audio Native ergänzen Music sinnvoll. So erzeugt ihr Voiceovers, Übersetzungen und Musik aus einer Hand und könnt die Assets anschließend technisch und rechtlich sauber in eure Inhalte integrieren.

QUELLEN
ElevenMusic
ElevenMusic Prompt Guide