Google AI Studio Leak zeigt Voice Cloning

Ein Google Logo mit Sprache

Nano Banana

Kurzfassung
▾

Quellen
▾

Ein Leak im Google AI Studio enthüllt die neue Funktion „Create your Voice“ für Gemini 3 Flash. Nutzer können eigene Stimmprofile erstellen, wodurch die KI künftig mit dem persönlichen Timbre antwortet. Die native Integration soll besonders bei Video-KI für konsistente Charakterstimmen und bessere Synchronisation sorgen. Google arbeitet an Sicherheitsmechanismen gegen Deepfakes, ein offizielles Release-Datum steht noch aus.

The Decoder – Google bereitet wohl native Audio-Fähigkeiten für Gemini 3 Flash vor

TestingCatalog – Google tests voice cloning on AI Studio powered by Gemini

X (TestingCatalog) – BREAKING: Google is testing Voice Cloning on AI Studio

Times of AI – Google Reportedly Testing Voice Cloning and More in AI Studio

Ein Leak im Google AI Studio enthüllt eine neue Funktion namens „Create your Voice“ für Gemini 3 Flash. Nutzer sollen damit künftig eigene Stimmen klonen und nativ im Modell verwenden können. Eigene Stimme als KI-Modell Entwickler stießen in der Benutzeroberfläche von Google AI Studio auf diese neuen Einstellungsoptionen. Der Menüpunkt „Custom Voice“ erlaubt das Hochladen eigener Sprachaufnahmen oder das direkte Einsprechen von Referenzmaterial. Die KI analysiert diese Daten in wenigen Augenblicken und generiert daraus ein synthetisches Stimmprofil. Das Ziel ist eine personalisierte Audio-Ausgabe mit hohem Nutzwert. Anstatt auf vorgefertigte Standardstimmen zurückzugreifen, antwortet der Chatbot künftig mit dem Timbre des Nutzers oder einer spezifisch definierten Charakterstimme. Diese Funktion tauchte kurzzeitig in der Testumgebung auf, was auf eine baldige Integration in die Entwickler-Tools hindeutet. + Quelle: testingcatalog.com Durchbruch für Video-KI Besonders für Content Creator und die Filmindustrie löst diese Funktion ein beständiges Problem. Video-Modelle haben aktuell noch Schwierigkeiten, Stimmen gekonnt und konsistent mit Charakteren zu verbinden. Produzenten nutzen daher oft umständliche Workflows über externe Anbieter wie ElevenLabs. Die native Zuweisung einer festen Stimme direkt im Modell könnte die Synchronisation revolutionieren. Gerade für KI-Influencer oder automatisierte Videoproduktionen sorgt dies für eine durchgängige Charakteridentität. Die Stimme bleibt stabil, egal was der Charakter sagt oder in welcher Sprache er spricht. Anzeige Sicherheit vor Release Die Technologie birgt jedoch Risiken. Die Erstellung von Deepfakes wird durch solche integrierten Tools vereinfacht. Google arbeitet daher im Hintergrund an strengen Sicherheitsmechanismen und Wasserzeichen für Audio-Daten. Aktuell bleibt die Funktion im AI Studio verborgen oder ist nur für einen sehr kleinen Kreis von Testern sichtbar. Ein offizielles Release-Datum mit diesen Audio-Features steht noch aus.

Google AI Studio Leak zeigt Voice Cloning

Beitrags-Benachrichtigung

Ihr E-Mail Konto:

Häufigkeit der E-Mail Zusammenfassung:

Leser:innen sagen:

Beitrags-
Benachrichtigung