Schlagwort: Lyria

  • Neues KI-Modell von Google: Lyria 3 Pro generiert bis zu drei Minuten lange Songs

    Google macht KI-Musik länger und breiter verfügbar: Lyria 3 Pro erzeugt Songs mit bis zu drei Minuten Länge, inklusive Strophen, Refrains und Bridges. Laut Google wurde das Modell auf Inhalten trainiert, an denen es die entsprechenden Rechte hat – im Unterschied zum Musikgenerator Suno, der sich wegen möglicher Copyright-Verstöße mit Plattenfirmen vor Gericht streitet.

    Der Artikel Neues KI-Modell von Google: Lyria 3 Pro generiert bis zu drei Minuten lange Songs erschien zuerst auf The Decoder.

  • Lange Songs auf Knopfdruck mit Googles neuem KI-Modell

    Oberfläche von Google Labs Musik

    Nano Banana

    Kurzfassung

    Quellen

    Die KI-Plattform ProducerAI ist nun Teil von Google Labs und nutzt das Audio-Modell Lyria 3.
    Damit entfällt das bisherige 30-Sekunden-Limit, sodass Anwender vollständige Musikstücke über Text-Prompts generieren können.
    Spezifische Anpassungen wie Equalizer-Einstellungen werden direkt vom System verarbeitet und hörbar umgesetzt.
    Die Nutzung ist in einem vierstufigen SaaS-Modell organisiert, das von einer Gratisversion bis zum Profi-Tarif für 64 US-Dollar reicht.

    Google Blog: ProducerAI: Your music creation partner, now in Google Labs

    producer ai Plattform

    The Verge: This Chainsmokers-approved AI music producer is joining Google

    Die Musikplattform ProducerAI ist ab sofort Teil von Google Labs und nutzt das hauseigene KI-Modell Lyria 3. Anwender generieren damit vollständige Musikstücke direkt über Texteingaben. Die bisherige Limitierung von 30 Sekunden fällt weg. Anzeige Architektur und vollständige Song-Generierung Die Übernahme von ProducerAI in das experimentelle Google Labs bringt das Musikmodell Lyria 3 in eine neue Anwendungsumgebung. Der technische Kernvorteil dieser Integration liegt in der Aufhebung bisheriger Längenbeschränkungen. Während Lyria 3 bisher maximal 30 Sekunden in einem Durchgang berechnete, generiert das System nun problemlos längere Songs am Stück. Um Missbrauch vorzubeugen, bettet Google ein dauerhaftes SynthID-Wasserzeichen in die Audiodateien ein, das die maschinelle Herkunft nachweist. Ein Praxistest verdeutlicht die hohe Verarbeitungsgeschwindigkeit der Plattform. Ein Text-Prompt für einen „Celtic House Vibe“ inklusive der exakten Anweisung, den Bass per Equalizer um vier Dezibel anzuheben, wird in lediglich rund 30 Sekunden in ein fertiges Audiofile übersetzt. Die Benutzeroberfläche verarbeitet solche Mixing-Befehle somit direkt ohne den Umweg über externe Audiosoftware. Der folgende Versuch war mein erster überhaupt. + Quelle: producer ai Your browser does not support the audio element. Gestaffeltes Preismodell für Audioproduzenten Google strukturiert den Zugang zu ProducerAI über ein vierstufiges SaaS-Modell (Software as a Service), bei dem Nutzer die Anwendung und die benötigte Rechenleistung direkt über das Internet abonnieren, anstatt ein Programm lokal zu installieren. Die kostenlose Variante gewährt Zugriff auf tägliche Basis-Credits und erlaubt zwei simultane Generierungen. Wer die Plattform häufiger ansteuert, wählt den Starter-Plan für acht US-Dollar pro Monat. Dieser schaltet 3.000 monatliche Credits frei, was für die Erstellung von knapp 600 Songs ausreicht, und erhöht die parallelen Rechenprozesse auf acht. + Quelle: producer ai Für professionellere Produktionsumgebungen stehen zwei weitere Tarife bereit. Die Plus-Option kostet 24 US-Dollar und liefert 10.000 Credits für etwa 2.000 generierte Tracks. Am oberen Ende positioniert sich das Member-Abonnement für 64 US-Dollar monatlich. Abonnenten erhalten hier 30.000 Credits, 16 parallele Generierungen und Zugang zu exklusiven Discord-Kanälen sowie Vorabversionen. Die Plattform staffelt die Leistungskontingente somit streng nach dem monatlichen Produktionsvolumen der Anwender. Der Zugriff auf den Dienst erfolgt ab sofort über die Webseite producer.ai. Anzeige

  • Gemini generiert nun komplette Songs in Sekunden, ausprobiert!

    Google AI Music Cover

    Nano Banana

    Kurzfassung

    Quellen

    Google hat das KI-Musikmodell Lyria 3 in seine Gemini-App integriert, womit Nutzer per Text, Foto oder Video 30-sekündige Songs erstellen können.
    Die Bedienung erfolgt simpel über das Tools-Menü, wo verschiedene Musik-Stile, eigene Texte oder Medien als Vorlage dienen.
    Praxistests zeigen eine hohe Qualität, etwa bei der detailgetreuen Generierung eines 90er-Jahre-Raps oder eines epischen Gaming-Soundtracks.
    Zudem öffnet Google die Technologie über weitreichende APIs für Entwickler, um KI-Musik künftig in Spiele oder kommerzielle Medien einzubinden.

    A new way to express yourself: Gemini can now create music (Google Blog)

    Lyria 3 | Music Generation comes to Gemini (Google / YouTube)

    Google integriert das KI-Modell Lyria 3 in seine Gemini-App und ermöglicht damit die direkte Erzeugung von Musik. Anwender erstellen ab sofort durch die Eingabe von Texten, Fotos oder Videos vollständige, 30-sekündige Audiotracks.

    Multimodale Audio-Generierung Das zugrundeliegende Modell Lyria 3 verarbeitet nicht mehr ausschließlich strukturierte Textbefehle. Die Software analysiert hochgeladene Fotografien oder kurze Videoclips und extrahiert daraus visuelle Merkmale. Daraus leitet der Algorithmus dann passende musikalische Parameter wie Tempo, Instrumentierung und Stimmung ab. Diese multimodale Herangehensweise ersetzt die Notwendigkeit, komplexe musiktheoretische Vorgaben per Hand einzutippen. Der Algorithmus liefert nach wenigen Sekunden Berechnungszeit einen fertigen, 30 Sekunden langen Audiotrack. Das System erzeugt die Musikstücke vollständig autonom, eigene Liedtexte oder Melodien sind nicht erforderlich. Anzeige Bedienung und Praxisbeispiele Die Handhabung innerhalb der App ist simpel gestaltet. Anwender aktivieren die Funktion im Chatfenster über das „Tools“-Menü unter dem Punkt „Musik erstellen“, wo sich auch der Bildgenerator befindet. Die generierte Audioqualität erreicht dabei laut ersten Tests ein überraschend hohes Niveau. Für die Erstellung stehen diverse optionale Parameter zur Verfügung. Nutzer haben die Wahl aus 16 vorgefertigten Stil-Remixen und können zusätzlich eigene Textanweisungen, detaillierte Liedtexte sowie Fotos oder Videos als Ausgangsmaterial hochladen. + Quelle: Google Die Kombination dieser Eingaben liefert präzise Ergebnisse. Fordert ein Nutzer beispielsweise als Grundstil einen „90er Rap“ an und ergänzt den simplen Textbefehl, über künstliche Intelligenz zu rappen, liefert das System einen passenden, authentisch wirkenden Hip-Hop-Track inklusive Vocals. Your browser does not support the audio element.

    Hip Hop AI

    Copy

    rappe über „AI“

    Prompt vollständig anzeigen

    Auch komplexe und sehr spezifische Vorgaben setzt die Software um. Ein Befehl für einen orchestralen „World of Warcraft“-Soundtrack rund um das deutsche Twitch-Streamer-Projekt „Sauercrowd“ im Hardcore-Modus führt zu einem stimmigen Epic-Musikstück. Die KI integriert das geforderte Wort „Sauercrowd“ dabei fehlerfrei in den selbst generierten Liedtext und beachtet den Kontext. Your browser does not support the audio element.

    WoW Sauercrowd Test

    Copy

    Erstelle ein epischen World of Warcraft Soundtrack. Der Titel lautet „Sauercrowd“ und das Wort muss auch im Song vorkommen. Kontext: Sauercrowd ist ein deutsches World of Warcraft Projekt wo ganz viele Twitch Streamer WoW im Hardcore Mode durchspielen. Erstelle entsprechend einen epischen Soundtrack mit Text.

    Prompt vollständig anzeigen

    Architektur und Schnittstellen Technisch baut Lyria 3 auf den bisherigen Audio-Forschungsarbeiten von Google DeepMind auf. Die Architektur zielt darauf ab, typische Artefakte bei der KI-gestützten Klangerzeugung zu minimieren und eine konsistente Audioqualität über die gesamte Laufzeit zu halten. Neben der Integration in die App öffnet der Konzern die Technologie für den professionellen Einsatz. Softwareentwickler greifen über die Gemini API und die Cloud-Plattform Vertex AI auf das Modell zu. Dies ermöglicht die Einbettung der Echtzeit-Musikgenerierung in externe Programme, beispielsweise für die dynamische Vertonung von Videospielen oder kommerziellen Medienproduktionen. Die Verteilung der neuen Audio-Funktionen erfolgt ab sofort schrittweise an alle Nutzer der Gemini-App. Zu den genauen Preiskonditionen für die API-Nutzung durch externe Entwickler machte das Unternehmen noch keine Angaben. Anzeige

  • Google bringt KI-Musikgenerator Lyria 3 in die Gemini-App

    Google bringt mit Lyria 3 einen KI-Musikgenerator in die Gemini-App. Das Modell erstellt 30-sekündige Tracks mit Gesang und Lyrics aus Textbeschreibungen oder Fotos.

    Der Artikel Google bringt KI-Musikgenerator Lyria 3 in die Gemini-App erschien zuerst auf The Decoder.