Google AI Studio Leak zeigt Voice Cloning

Ein Google Logo mit Sprache

Nano Banana

Kurzfassung

Quellen

Ein Leak im Google AI Studio enthüllt die neue Funktion „Create your Voice“ für Gemini 3 Flash. Nutzer können eigene Stimmprofile erstellen, wodurch die KI künftig mit dem persönlichen Timbre antwortet. Die native Integration soll besonders bei Video-KI für konsistente Charakterstimmen und bessere Synchronisation sorgen. Google arbeitet an Sicherheitsmechanismen gegen Deepfakes, ein offizielles Release-Datum steht noch aus.

The Decoder – Google bereitet wohl native Audio-Fähigkeiten für Gemini 3 Flash vor

TestingCatalog – Google tests voice cloning on AI Studio powered by Gemini

X (TestingCatalog) – BREAKING: Google is testing Voice Cloning on AI Studio

Times of AI – Google Reportedly Testing Voice Cloning and More in AI Studio

Ein Leak im Google AI Studio enthüllt eine neue Funktion namens „Create your Voice“ für Gemini 3 Flash. Nutzer sollen damit künftig eigene Stimmen klonen und nativ im Modell verwenden können. Eigene Stimme als KI-Modell Entwickler stießen in der Benutzeroberfläche von Google AI Studio auf diese neuen Einstellungsoptionen. Der Menüpunkt „Custom Voice“ erlaubt das Hochladen eigener Sprachaufnahmen oder das direkte Einsprechen von Referenzmaterial. Die KI analysiert diese Daten in wenigen Augenblicken und generiert daraus ein synthetisches Stimmprofil. Das Ziel ist eine personalisierte Audio-Ausgabe mit hohem Nutzwert. Anstatt auf vorgefertigte Standardstimmen zurückzugreifen, antwortet der Chatbot künftig mit dem Timbre des Nutzers oder einer spezifisch definierten Charakterstimme. Diese Funktion tauchte kurzzeitig in der Testumgebung auf, was auf eine baldige Integration in die Entwickler-Tools hindeutet. + Quelle: testingcatalog.com Durchbruch für Video-KI Besonders für Content Creator und die Filmindustrie löst diese Funktion ein beständiges Problem. Video-Modelle haben aktuell noch Schwierigkeiten, Stimmen gekonnt und konsistent mit Charakteren zu verbinden. Produzenten nutzen daher oft umständliche Workflows über externe Anbieter wie ElevenLabs. Die native Zuweisung einer festen Stimme direkt im Modell könnte die Synchronisation revolutionieren. Gerade für KI-Influencer oder automatisierte Videoproduktionen sorgt dies für eine durchgängige Charakteridentität. Die Stimme bleibt stabil, egal was der Charakter sagt oder in welcher Sprache er spricht. Anzeige Sicherheit vor Release Die Technologie birgt jedoch Risiken. Die Erstellung von Deepfakes wird durch solche integrierten Tools vereinfacht. Google arbeitet daher im Hintergrund an strengen Sicherheitsmechanismen und Wasserzeichen für Audio-Daten. Aktuell bleibt die Funktion im AI Studio verborgen oder ist nur für einen sehr kleinen Kreis von Testern sichtbar. Ein offizielles Release-Datum mit diesen Audio-Features steht noch aus.

TRAUMWELT.exe ist kein gewöhnliches Buch. Es ist ein Blick durch den Spalt einer Tür, die sich längst geöffnet hat – in eine Welt, in der Maschinen träumen, Städte flüstern und Ethik verhandelbar geworden ist. Eine Sammlung visionärer Geschichten, die an der Schwelle zwischen Fiktion und Realität tanzen – so plausibel erzählt, dass du dich unweigerlich fragst: Ist das noch Zukunft oder schon Gegenwart?

Leser:innen sagen:

„Wie Black Mirror, nur philosophischer und näher an der Wirklichkeit.“, Lisa M.
„Jede Geschichte ist ein Gedankensprung in eine andere Zukunft.“, Stefan K.
„Beunruhigend schön. Eine literarische Simulation unserer nahen Zukunft.“, Albert B.