Schlagwort: Labs

  • Flux VTO: Virtuelle Anprobe in 4 Sekunden

    Flux virtual try on mit Kleidung

    Flux

    Kurzfassung

    Quellen

    Black Forest Labs hat mit Flux VTO ein neues KI-Modell für die virtuelle Anprobe vorgestellt.
    Die Software generiert realistische Bilder in unter vier Sekunden und bewahrt feine Details wie Logos oder Nähte.
    Nutzer können bis zu vier Kleidungsstücke übereinander in einer kostenlosen Demo direkt im Browser testen.

    Black Forest Labs – FLUX VTO: Virtual Try-On at scale
    X – Black Forest Labs Post

    Black Forest Labs hat das neue KI-Modell Flux VTO vorgestellt. Die Software ermöglicht eine schnelle und detailgetreue virtuelle Anprobe von Kleidung. Nutzer können damit Kleidungsstücke in unter vier Sekunden realistisch an Personen visualisieren.

    Twitter Beitrag – Cookies links unten aktivieren.

    New release: FLUX Virtual Try-On. Sub‑4 second generations across thousands of products at low cost and low latency. We optimized for keeping a person’s identity consistent and the garment’s logos, stitching, and prints all intact. Try the demo: https://t.co/8tmm7juVgW… pic.twitter.com/haa2EFnj1q — Black Forest Labs (@bfl_ml) May 28, 2026 Schwächen bisheriger Lösungen überwunden Bisherige Systeme für die virtuelle Anprobe scheiterten oft an der Praxistauglichkeit. Die Generierung eines Bildes dauerte in der Vergangenheit teilweise bis zu 30 Sekunden. Zudem veränderten ältere Modelle häufig die Gesichtszüge der abgebildeten Personen oder verfälschten wichtige Details der Kleidung. Flux VTO löst diese Probleme durch eine deutlich höhere Verarbeitungsgeschwindigkeit. Die Berechnung eines neuen Bildes erfolgt in weniger als vier Sekunden. Bei einer lokalen Installation der Software sind laut Angaben der Entwickler sogar Antwortzeiten von unter einer Sekunde möglich. Das System wurde speziell für den »Katalogmaßstab« großer Onlineshops konzipiert. Anzeige Detailtreue und vielschichtige Outfits Ein zentraler Fokus bei der Entwicklung lag auf der Bildqualität. Das Modell bewahrt die Identität der Person auf dem Ausgangsbild. Gleichzeitig bleiben spezifische Merkmale der Kleidungsstücke wie Logos, Nähte und Muster originalgetreu auf dem fertigen Foto erhalten. Die Software erlaubt es zudem, bis zu vier Kleidungsstücke gleichzeitig anzuwenden. Ein Hemd lässt sich beispielsweise korrekt unter einer Jacke platzieren. Die KI berechnet dabei das realistische visuelle Zusammenspiel der verschiedenen Stoffschichten. + Quelle: Flux Freier Zugang mit Einschränkungen Entwickler können das Modell ab sofort über eine API in eigene Shopsysteme integrieren. Interessierte Nutzer haben die Möglichkeit, die Technologie in einer kostenlosen Demoversion auf der Website des Herstellers mit Testkleidung und eigener Kleidung auszuprobieren. Die Nutzung unterliegt allerdings strengen Sicherheitsrichtlinien. Das System blockiert standardmäßig die Erstellung von Inhalten mit Bademode oder Unterwäsche. Das können wir in einem kurzen Selbstversuch bestätigen. Über die API kann man die »safety_tolerance« allerdings auch in 5 Stufen einstellen. Ausprobieren kann man das ganze kostenlos hier: Flux Virtual Try-On

  • Alphabet-Tochter Isomorphic Labs erhält Milliarden-Funding für KI-Arzneimittelforschung

    Isomorphic Labs, die KI-Arzneimittelforschungsfirma von Deepmind-Mitgründer Demis Hassabis, hat 2,1 Milliarden Dollar in einer Series-B-Runde eingesammelt, angeführt von Thrive Capital. Das Geld fließt in die hauseigene Plattform IsoDDE und den Weg Richtung klinische Studien.

    Der Artikel Alphabet-Tochter Isomorphic Labs erhält Milliarden-Funding für KI-Arzneimittelforschung erschien zuerst auf The Decoder.

  • KI-Spam-Webseiten fluten das Netz mit falschen Informationen und es werden schnell mehr

    Newsguard und der KI-Detektor Pangram Labs haben ein Echtzeitsystem gestartet, das sogenannte „KI Content Farmen“ identifiziert. Mehr als 3.000 solcher Seiten wurden bereits erfasst, jeden Monat kommen Hunderte hinzu. Tendenz steigend.

    Der Artikel KI-Spam-Webseiten fluten das Netz mit falschen Informationen und es werden schnell mehr erschien zuerst auf The Decoder.

  • AMI Labs: Yann LeCun sammelt über eine Milliarde Dollar für neues KI-Start-up in Europas größter Seed-Runde

    Yann LeCun, ehemaliger Chef-KI-Wissenschaftler bei Meta und Turing-Preisträger, hat mit seinem neuen Start-up Advanced Machine Intelligence Labs (AMI Labs) über eine Milliarde Dollar in Europas größter Seed-Finanzierungsrunde eingesammelt, berichtet die Financial Times.

    Der Artikel AMI Labs: Yann LeCun sammelt über eine Milliarde Dollar für neues KI-Start-up in Europas größter Seed-Runde erschien zuerst auf The Decoder.

  • Black Forest Labs: Neues Self-Flow-Verfahren halbiert KI-Trainingszeit

    Ein Baum wird immer größer

    Nano Banana

    Kurzfassung

    Quellen

    Black Forest Labs hat die neue Trainingsmethode Self-Flow für generative KI-Modelle vorgestellt.
    Das Verfahren beschleunigt das Training von Text-to-Image, Text-to-Video und Text-to-Audio deutlich.
    Im Gegensatz zu bisherigen Ansätzen wie REPA benötigt Self-Flow keine externen Hilfsmodelle, sondern nutzt eine Kopie seiner selbst als Lehrer.

    Black Forest Labs: Self-Flow

    Black Forest Labs: Self-Flow Research Paper (PDF)

    Das KI-Unternehmen Black Forest Labs hat mit „Self-Flow“ eine neue Trainingsmethode für generative KI-Modelle vorgestellt. Das Verfahren beschleunigt das Training für Bild-, Video- und Audiogenerierung deutlich und macht externe Hilfsmodelle komplett überflüssig. Anzeige Effizientes Training ohne externe Lehrer Flow Matching hat sich als technisches Fundament für moderne KI-Modelle etabliert. Der Algorithmus formt dabei aus scheinbar zufälligem Rauschen schrittweise klare Bilder oder Töne. Das Training solcher Systeme verschlingt in der Praxis jedoch immense Rechenleistung. Bisherige Ansätze zur Beschleunigung, wie das sogenannte Representation-Aligned Flow Matching (REPA), setzen daher auf externe, bereits fertig trainierte Modelle. Diese „Teacher“ geben dem trainierenden „Student“-Modell eine feste Orientierung, um schneller korrekte Ergebnisse zu erzielen. Für visuelle Aufgaben kam hier oft DINOv2 zum Einsatz, für Audio das Modell MERT. Dieser Ansatz bindet jedoch zusätzliche Ressourcen. Gleichzeitig erfordert er für jeden Medientyp ein exakt passendes Hilfsmodell, was die Entwicklung verkompliziert. Self-Flow löst dieses Problem nun durch einen intelligenten internen Lernprozess. Das System erstellt während des Trainings kontinuierlich eine zeitlich verzögerte Kopie des eigenen Modells, die sogenannte Exponential Moving Average (EMA). Diese minimal ältere, aber stabilere Kopie übernimmt kurzerhand die Rolle des Lehrers. Das Modell berechnet einen Fehlerwert zwischen seinen aktuellen Vorhersagen und den Repräsentationen der EMA-Kopie. Dadurch bringt sich das Modell die optimalen Strukturen der Daten effektiv selbst bei, ohne auf externe Parameter angewiesen zu sein. + Quelle: Black Forrest Messbare Leistungssprünge über alle Medien Die Entwickler belegen die Effizienz von Self-Flow anhand verschiedener Benchmarks für unterschiedliche Datentypen. Bei der Text-to-Image-Generierung erreicht das neue Verfahren das Qualitätsniveau von klassischem Flow Matching 2,8-mal schneller. + + Quelle: Black Forrest Auch bei Bewegtbild und Ton zeigt sich der architektonische Vorteil. Bei Text-to-Video-Aufgaben verzeichnet Black Forest Labs eine 1,8-fache Beschleunigung gegenüber dem Standardverfahren. Im Bereich Audio arbeitet die Methode 2,1-mal schneller. Zudem übertrifft Self-Flow die bisherige REPA-Methode bei gleicher Anzahl an Trainingsschritten in allen drei Kategorien sichtbar. Die Qualität der generierten Inhalte steigt, was sich an etablierten Metriken wie dem Frechet Inception Distance (FID) Wert für Bilder klar ablesen lässt. Die neue Methode vereinfacht die Entwicklung zukünftiger KI-Architekturen spürbar. Forscher benötigen deutlich weniger Rechenzeit und eine weit weniger komplexe Software-Infrastruktur, um leistungsstarke multimodale Modelle aufzubauen. Anzeige

  • Social-Media-Benchmark: Fünf KI-Modelle konkurrieren auf X um Reichweite

    Raster aus Logos mehrerer KI-Modelle als Symbol für ihren Wettbewerb in der Social Arena.

    Das KI-Benchmarking-Startup Arcada Labs lässt derzeit fünf führende KI-Modelle als autonome Social-Media-Agenten auf X gegeneinander antreten.

    Der Artikel Social-Media-Benchmark: Fünf KI-Modelle konkurrieren auf X um Reichweite erschien zuerst auf The Decoder.

  • Lange Songs auf Knopfdruck mit Googles neuem KI-Modell

    Oberfläche von Google Labs Musik

    Nano Banana

    Kurzfassung

    Quellen

    Die KI-Plattform ProducerAI ist nun Teil von Google Labs und nutzt das Audio-Modell Lyria 3.
    Damit entfällt das bisherige 30-Sekunden-Limit, sodass Anwender vollständige Musikstücke über Text-Prompts generieren können.
    Spezifische Anpassungen wie Equalizer-Einstellungen werden direkt vom System verarbeitet und hörbar umgesetzt.
    Die Nutzung ist in einem vierstufigen SaaS-Modell organisiert, das von einer Gratisversion bis zum Profi-Tarif für 64 US-Dollar reicht.

    Google Blog: ProducerAI: Your music creation partner, now in Google Labs

    producer ai Plattform

    The Verge: This Chainsmokers-approved AI music producer is joining Google

    Die Musikplattform ProducerAI ist ab sofort Teil von Google Labs und nutzt das hauseigene KI-Modell Lyria 3. Anwender generieren damit vollständige Musikstücke direkt über Texteingaben. Die bisherige Limitierung von 30 Sekunden fällt weg. Anzeige Architektur und vollständige Song-Generierung Die Übernahme von ProducerAI in das experimentelle Google Labs bringt das Musikmodell Lyria 3 in eine neue Anwendungsumgebung. Der technische Kernvorteil dieser Integration liegt in der Aufhebung bisheriger Längenbeschränkungen. Während Lyria 3 bisher maximal 30 Sekunden in einem Durchgang berechnete, generiert das System nun problemlos längere Songs am Stück. Um Missbrauch vorzubeugen, bettet Google ein dauerhaftes SynthID-Wasserzeichen in die Audiodateien ein, das die maschinelle Herkunft nachweist. Ein Praxistest verdeutlicht die hohe Verarbeitungsgeschwindigkeit der Plattform. Ein Text-Prompt für einen „Celtic House Vibe“ inklusive der exakten Anweisung, den Bass per Equalizer um vier Dezibel anzuheben, wird in lediglich rund 30 Sekunden in ein fertiges Audiofile übersetzt. Die Benutzeroberfläche verarbeitet solche Mixing-Befehle somit direkt ohne den Umweg über externe Audiosoftware. Der folgende Versuch war mein erster überhaupt. + Quelle: producer ai Your browser does not support the audio element. Gestaffeltes Preismodell für Audioproduzenten Google strukturiert den Zugang zu ProducerAI über ein vierstufiges SaaS-Modell (Software as a Service), bei dem Nutzer die Anwendung und die benötigte Rechenleistung direkt über das Internet abonnieren, anstatt ein Programm lokal zu installieren. Die kostenlose Variante gewährt Zugriff auf tägliche Basis-Credits und erlaubt zwei simultane Generierungen. Wer die Plattform häufiger ansteuert, wählt den Starter-Plan für acht US-Dollar pro Monat. Dieser schaltet 3.000 monatliche Credits frei, was für die Erstellung von knapp 600 Songs ausreicht, und erhöht die parallelen Rechenprozesse auf acht. + Quelle: producer ai Für professionellere Produktionsumgebungen stehen zwei weitere Tarife bereit. Die Plus-Option kostet 24 US-Dollar und liefert 10.000 Credits für etwa 2.000 generierte Tracks. Am oberen Ende positioniert sich das Member-Abonnement für 64 US-Dollar monatlich. Abonnenten erhalten hier 30.000 Credits, 16 parallele Generierungen und Zugang zu exklusiven Discord-Kanälen sowie Vorabversionen. Die Plattform staffelt die Leistungskontingente somit streng nach dem monatlichen Produktionsvolumen der Anwender. Der Zugriff auf den Dienst erfolgt ab sofort über die Webseite producer.ai. Anzeige

  • Fei-Fei Lis Startup World Labs sammelt eine Milliarde Dollar für räumliche Intelligenz ein

    World Labs, das KI-Startup von Fei-Fei Li, sammelt eine Milliarde Dollar in neuer Finanzierungsrunde ein, um mit sogenannten Weltmodellen KI-Systemen beizubringen, die dreidimensionale Welt zu verstehen und darin zu agieren.

    Der Artikel Fei-Fei Lis Startup World Labs sammelt eine Milliarde Dollar für räumliche Intelligenz ein erschien zuerst auf The Decoder.

  • Isomorphic Labs stellt neue KI-Engine für präziseres Medikamenten-Design vor

    Isomorphic Labs, das KI-Medizin-Start-up von Google Deepmind, hat ein neues System namens „Isomorphic Labs Drug Design Engine“ (IsoDDE) vorgestellt, das AlphaFold 3 übertreffen soll.

    Der Artikel Isomorphic Labs stellt neue KI-Engine für präziseres Medikamenten-Design vor erschien zuerst auf The Decoder.

  • OpenAI setzt auf Ultraschall statt Chip im menschlichen Gehirn

    Sam Altman mit Merge Labs und Elon Musk mit Neuralink

    Nano Banana

    Kurzfassung

    Quellen

    Sam Altman und OpenAI investieren 252 Millionen Dollar in das Startup Merge Labs, das auf Ultraschall-Technologie setzt. Diese neuen Gehirn-Computer-Schnittstellen funktionieren ohne operative Eingriffe und bieten dennoch hohe Datenraten. Gleichzeitig wächst die Konkurrenz aus China, wo Unternehmen wie Gestalta ebenfalls nicht-invasive Lösungen zur Marktreife bringen.

    Wired – This Chinese Startup Wants to Build a New Brain-Computer Interface

    Wired – OpenAI Invests in Sam Altman’s New Brain-Tech Startup Merge Labs

    TechCrunch – OpenAI invests in Sam Altman’s brain computer interface startup Merge Labs

    OreateAI – Competing With Musk’s Neuralink: Unveiling the Leading BCI Company

    Pandaily – China Tests Its First Fully Implanted Brain-Computer Interface

    Sam Altman investiert massiv in das Neurotech-Startup Merge Labs, das auf Ultraschall statt invasive Chips setzt. Diese Technologie verspricht eine präzise Gehirn-Computer-Verbindung ohne riskante Operationen am offenen Schädel. Der Angriff auf die Hardware-Grenze OpenAI-Chef Sam Altman wettet mit einer Investition von 252 Millionen Dollar gegen den bisherigen Goldstandard invasiver Implantate. Das Ziel seiner Beteiligung ist Merge Labs, ein Unternehmen, das Gehirn-Computer-Schnittstellen (BCI) auf Basis von Ultraschall entwickelt. Diese Technologie nutzt hochfrequente Schallwellen, um neuronale Aktivitäten durch den Schädelknochen hindurch zu lesen. Nutzer benötigen keine riskante Operation, wie sie bei Elon Musks Neuralink Voraussetzung ist. Die Bandbreite der übertragenen Daten soll dabei deutlich höher liegen als bei herkömmlichen EEG-Kappen. Der Einstieg von OpenAI signalisiert ein strategisches Interesse an direkteren Kommunikationswegen zwischen menschlichem Gehirn und künstlicher Intelligenz. Merge Labs positioniert sich damit als Schlüsselfigur für die nächste Generation der Mensch-Maschine-Interaktion. Anzeige Konkurrenz aus Fernost Parallel dazu formiert sich in China eine starke Konkurrenz, die ähnliche technologische Pfade beschreitet. Das Startup Gestalta treibt die Entwicklung von Ultraschall-BCIs voran und zielt auf den globalen Markt. Chinesische Unternehmen profitieren derzeit von einer Investitionswelle in Hard-Tech-Firmen. Mehrere Akteure aus der Neurotechnologie bereiten Börsengänge vor oder haben diese bereits vollzogen. Qiangnao Tech (BrainCo) gilt hierbei als Vorreiter und zeigt, wie weit die Kommerzialisierung in Asien bereits fortgeschritten ist. Die Lücke zwischen Leistung und Komfort Bisher mussten sich Anwender zwischen hoher Datenqualität durch Implantate oder geringer Invasivität durch externe Sensoren entscheiden. Ultraschall-Technologie schließt diese Lücke effektiv. Sie bietet eine räumliche Auflösung, die für komplexe Steuerungsaufgaben notwendig ist, ohne den Körper physikalisch zu verletzen. Das senkt die Hemmschwelle für den Einsatz im Alltag drastisch. Anwendungen reichen von der Steuerung prothetischer Gliedmaßen bis hin zur direkten Interaktion mit Software-Interfaces. Der Markt bewegt sich weg von medizinischen Nischenprodukten hin zu skalierbaren Consumer-Lösungen. Mit Schwergewichten wie OpenAI und agilen chinesischen Startups im Ring beschleunigt sich der Innovationszyklus im Jahr 2026 spürbar.