Schlagwort: Microsoft

  • Windows 11 übergibt die Kontrolle an die KI

    Eine Hand reicht aus dem PC heraus und steuert selbst die Tastatur

    Nano Banana

    Kurzfassung

    Quellen

    Microsoft führt „Copilot Actions“ für Windows 11 ein, wodurch KI-Agenten autonom Aufgaben auf dem PC ausführen können. Nach der Kritik an der „Recall“-Funktion setzt Microsoft auf erhöhte Sicherheit durch isolierte Umgebungen und explizite Nutzererlaubnis. Die Funktion startet als experimentelle Vorschau für Windows Insider und ist standardmäßig deaktiviert. Experten warnen weiterhin vor neuen Risiken wie Cross-Prompt-Injection-Angriffen, die die Agenten manipulieren könnten.

    Windows Experience Blog ZDNET Microsoft Learn PureInfoTech FindArticles

    Microsoft führt eine neue Ära der KI in Windows 11 ein. Die Funktion „Copilot Actions“ soll es der künstlichen Intelligenz erstmals erlauben, eigenständig Aufgaben auf dem PC zu erledigen. Nach dem Debakel um die Recall-Funktion steht die Frage nach dem Vertrauen und der Sicherheit im Mittelpunkt. Autonome Assistenten für den Desktop Microsoft erweitert Copilot um „Copilot Actions“. Diese Funktion verwandelt den Assistenten in einen aktiven Agenten. Nutzer können der KI komplexe, mehrstufige Aufgaben übertragen. Der Agent interagiert dann selbstständig mit Anwendungen, durchsucht Dateien oder führt Aktionen im Namen des Nutzers aus. Denkbar sind Aufgaben wie das Organisieren von Dokumenten oder das Starten von Arbeitsabläufen. Auch eine Sprachaktivierung über „Hey Copilot“ ist geplant, um diese agentenfähige KI direkt anzusprechen. Lektionen aus dem Recall-Debakel Microsoft ist sich der Brisanz bewusst. Das Vertrauen wurde durch die umstrittene Recall-Funktion stark beschädigt. Bei den neuen KI-Agenten wählt das Unternehmen daher einen vorsichtigeren Ansatz. Die Funktion ist standardmäßig deaktiviert. Nutzer müssen die „Copilot Actions“ explizit einschalten. Microsoft rollt die Funktion zunächst nur als experimentelle Vorschau für Windows Insider aus. Technische Hürden sollen die Sicherheit erhöhen. Die KI-Agenten arbeiten in einer isolierten Umgebung, einer Art Sandbox. Jede Aktion benötigt angeblich eine schrittweise Berechtigung durch den Nutzer und wird digital signiert. Neue Angriffsflächen für Hacker Trotz dieser Maßnahmen warnen Experten vor erheblichen Sicherheitsrisiken. Die autonomen Agenten schaffen eine völlig neue Angriffsfläche auf dem Betriebssystem. Ein Hauptproblem sind sogenannte Cross-Prompt-Injection-Angriffe. Dabei könnten schädliche Inhalte in E-Mails oder Webseiten die Anweisungen des Agenten manipulieren. Die KI könnte so zu Aktionen verleitet werden, die der Nutzer nie beabsichtigt hat. Die Balance zwischen Nützlichkeit und Vertrauen wird die größte Herausforderung.

  • Der neue KI-Agent, der Programmierer bald arbeitslos macht

    Manus Intro Bild

    Nano Banana

    Kurzfassung

    Quellen

    Manus hat Version 1.5 seines KI-Agenten vorgestellt, der Aufgaben viermal schneller und 15 Prozent besser erledigt. Das System kann aus einer einzigen Anweisung voll funktionsfähige Web-Anwendungen inklusive Backend und Datenbank erstellen. Microsoft integriert die Technologie von Manus direkt in den Copilot von Windows 11, um dessen Fähigkeiten zu erweitern. Es gibt eine leistungsstarke Bezahlversion (Manus-1.5) und eine kostenlose, leicht reduzierte Variante (Manus-1.5-Lite).

    The Decoder The Decoder (DE) Manus Official Blog Unite AI TestingCatalog

    Das KI-Unternehmen Manus hat eine neue Version seines KI-Agentensystems vorgestellt. Manus 1.5 soll Aufgaben deutlich schneller und mit höherer Qualität erledigen. Die größte Neuerung ist die Fähigkeit, aus einer einzigen Anweisung komplette Web-Anwendungen mit Datenbank und Nutzerverwaltung zu erstellen. Vierfache Geschwindigkeit und höhere Präzision Manus hat die Architektur seines KI-Agenten grundlegend überarbeitet. Dadurch konnte die Bearbeitungszeit für komplexe Aufgaben drastisch reduziert werden. Benötigte das Vorgängermodell noch rund 15 Minuten für einen Arbeitsauftrag, erledigt Manus 1.5 diesen nun in durchschnittlich vier Minuten. Gleichzeitig gibt das Unternehmen an, die Qualität der Ergebnisse um 15 Prozent gesteigert zu haben. Für Nutzer stehen zwei Versionen zur Verfügung. Die leistungsstärkste Variante, Manus-1.5, ist für zahlende Abonnenten zugänglich. Eine leicht abgespeckte Version namens Manus-1.5-Lite kann von allen Nutzern kostenlos verwendet werden.

    Vom Befehl zur fertigen Anwendung Die beeindruckendste Fähigkeit von Manus 1.5 ist die autonome Entwicklung von Software. Der KI-Agent kann aus einer einfachen textlichen Beschreibung eine voll funktionsfähige Web-Anwendung erstellen. Dazu gehören das Backend, eine Datenbankanbindung und die komplette Verwaltung von Nutzern. Dieser Entwicklungsprozess läuft weitgehend selbstständig ab. Der Agent analysiert die Anforderung, plant die notwendigen Schritte und schreibt den Programmcode. Damit erweitert Manus die Fähigkeiten von KI-Systemen von reinen Assistenzfunktionen hin zu eigenständigen Entwickler-Werkzeugen. + Quelle: Manus Microsoft integriert Manus in Windows 11 Der technologische Fortschritt hat auch die Aufmerksamkeit großer Konzerne geweckt. Microsoft gab bekannt, die Agenten-Technologie von Manus direkt in sein Betriebssystem Windows 11 zu integrieren. Diese Einbindung ist Teil einer umfassenderen Strategie, KI-Funktionen tiefer in die Benutzeroberfläche zu verankern. Die Integration ermöglicht es dem Windows-eigenen Assistenten Copilot, auf die spezialisierten Fähigkeiten von Manus zuzugreifen. Nutzer können dadurch komplexe Aufgaben direkt über das Betriebssystem an den KI-Agenten delegieren.

  • Claude verbindet sich mit Microsoft 365 und bekommt Enterprise-Suche

    Claude von Anthropic lässt sich nun mit Microsoft 365 verbinden und kann Inhalte aus Outlook, SharePoint, OneDrive und Teams nutzen.

    Der Artikel Claude verbindet sich mit Microsoft 365 und bekommt Enterprise-Suche erschien zuerst auf THE-DECODER.de.

  • Hey Copilot: Microsoft macht Copilot zur neuen Kommandozentrale von Windows 11

    Microsoft integriert generative KI tiefer in Windows 11. Neue Funktionen wie Sprachsteuerung, visuelle Analyse und autonome Agenten sollen Copilot stärker in das Betriebssystem einbinden.

    Der Artikel Hey Copilot: Microsoft macht Copilot zur neuen Kommandozentrale von Windows 11 erschien zuerst auf THE-DECODER.de.

  • Microsoft stellt erstes eigenes Bild-KI-Modell vor

    Microsoft hat sein erstes selbst entwickeltes Bildgenerator-Modell MAI-Image-1 vorgestellt.

    Der Artikel Microsoft stellt erstes eigenes Bild-KI-Modell vor erschien zuerst auf THE-DECODER.de.

  • Microsofts erster KI-Bildgenerator ist 1. Liga

    Der Text Mai-image-1 am Strand

    Nano Banana

    Kurzfassung

    Quellen

    Microsoft hat mit MAI-Image-1 einen eigenen KI-Bildgenerator vorgestellt, der direkt in den Top 10 der LMArena-Rangliste debütierte.
    Das Modell ist auf Fotorealismus, hohe Geschwindigkeit und die Vermeidung generischer Stile ausgelegt, um kreative Prozesse zu beschleunigen.
    Die Entwicklung ist ein strategischer Schritt zur technologischen Unabhängigkeit von Partnern wie OpenAI und ein direkter Angriff auf Konkurrenten.
    MAI-Image-1 soll in Kürze in Microsoft-Produkte wie Copilot und den Bing Image Creator integriert werden.

    Microsoft AI
    News9Live
    Marktechpost
    Heise
    Mashable

    Microsoft betritt die Arena der KI-Bildgeneratoren mit einer Eigenentwicklung. Das neue Modell MAI-Image-1 platziert sich aus dem Stand in den Top 10 der offenen Vergleichsplattform LMArena. Damit fordert der Konzern die etablierte Konkurrenz von Google und dem Partner OpenAI direkt heraus. Fokus auf Tempo und Fotorealismus Microsoft entwickelte MAI-Image-1 mit drei klaren Zielen. Das System soll fotorealistische Bildqualität liefern und wiederholbare Einheitsstile vermeiden. Gleichzeitig legt der Konzern Wert auf eine hohe Reaktionsgeschwindigkeit für schnelle, iterative Arbeitsabläufe. Dies gelang durch eine strenge Auswahl der Trainingsdaten und systematisches Feedback aus der Kreativbranche. Das Modell zeigt besondere Stärken bei der Erstellung von Landschaften. Es erzeugt zudem physikalisch plausible Beleuchtungsszenarien mit Streulicht, Reflexionen und komplexen Schatten. Laut Microsoft arbeitet MAI-Image-1 dabei mit einer geringeren Latenz als viele größere und langsamere Konkurrenzmodelle. Quelle: Microsoft – Bilder mit MAI-Image Ein Debüt in der Spitzenklasse Der Einstieg in die Top 10 der LMArena-Rangliste positioniert Microsofts Modell direkt in der Spitzengruppe. Die Liste bewertet KI-Modelle durch anonymisierte Nutzerabstimmungen. MAI-Image-1 muss sich dort gegen starke Konkurrenten beweisen. An der Spitze stehen aktuell Systeme wie Hunyuan-image-3.0 des chinesischen Konzerns Hunyuan und Googles Gemini-Modell, bekannt als „Nano Banana“. Auch der bisherige Partner OpenAI ist mit GPT-Image-1 stark vertreten. Dieses Modell erzeugte zuletzt durch seine Fähigkeit, präzise Kunststile zu treffen, große Aufmerksamkeit. LMArena bietet eine gute Umgebung, um die Leistung der verschiedenen Generatoren bei identischen Aufgabenstellungen direkt zu vergleichen. + Quelle: LLMArena – 14.10.25 Strategischer Schritt zur Unabhängigkeit Die Entwicklung von MAI-Image-1 ist Teil einer breiteren Strategie. Microsoft baut sein Portfolio an hauseigenen KI-Modellen konsequent aus. Dazu gehören auch der Sprachgenerator MAI-Voice-1 und die Reihe der kleineren Phi-Sprachmodelle. Der Konzern will sich damit unabhängiger von externen Partnern machen. Diese Entwicklung markiert eine zunehmende Emanzipation von OpenAI. Bisher nutzte Microsoft für seine Produkte vor allem dessen DALL-E-Technologie. Nun verfolgt das Unternehmen einen eigenen Weg, um Qualität und Geschwindigkeit in Produkten wie Copilot und dem Bing Image Creator selbst zu kontrollieren. Die Integration von MAI-Image-1 soll laut Microsoft sehr bald erfolgen.

  • Microsoft erweitert Azure AI Foundry mit neuen OpenAI-Modellen

    Microsoft hat auf dem OpenAI DevDay im Oktober 2025 mehrere neue multimodale KI-Modelle für Azure AI Foundry vorgestellt.

    Der Artikel Microsoft erweitert Azure AI Foundry mit neuen OpenAI-Modellen erschien zuerst auf THE-DECODER.de.

  • Microsofts neues KI-Angebot soll mehr bieten als ChatGPT Plus – für einen Cent weniger

    Rund angeordnete Icons der Microsoft 365-Apps Word, PowerPoint, Teams, Loop, Excel, SharePoint, OneDrive, OneNote und Outlook.

    Microsoft reorganisiert seine Abonnement-Struktur und führt Microsoft 365 Premium für 19,99 Dollar pro Monat ein. Das neue Angebot kombiniert KI-Features mit Produktivitäts-Apps. Copilot Pro wird vom Markt genommen.

    Der Artikel Microsofts neues KI-Angebot soll mehr bieten als ChatGPT Plus – für einen Cent weniger erschien zuerst auf THE-DECODER.de.

  • KI-Stimmen auf neuem Level

    KI spricht in einem Podcast Raum miteinander

    KI-Stimmen auf neuem Level Vergiss alles, was du bisher kanntest. Microsofts VibeVoice erzeugt so realistische und lange Gespräche, dass die Grenzen zur Realität verschwimmen. Kurzfassung | Andreas Becker, 28.09.25
    gpt-image-1 | All-AI.de EINLEITUNG Microsoft hat eine neue KI vorgestellt, die die Produktion von Audioinhalten grundlegend verändern könnte. Das System namens VibeVoice kann als erstes seiner Art komplette, bis zu 90 Minuten lange Gespräche mit vier verschiedenen Sprechern in einem einzigen Durchgang erzeugen. Diese Entwicklung stellt einen technischen Durchbruch dar, da bisherige Modelle oft nach wenigen Minuten oder bei mehr als zwei Stimmen an ihre Grenzen stießen. Für Podcaster und Hörbuchproduzenten eröffnen sich damit völlig neue Möglichkeiten. NEWS Ein neuer Ansatz für die Sprach-KI Die entscheidende Neuerung von VibeVoice liegt in einer hocheffizienten Methode zur Audiokompression. Ein von Microsoft Research entwickelter „Speech Tokenizer“ komprimiert Audiodaten so stark, dass selbst sehr lange Gespräche komplett im Arbeitsspeicher eines Computers verarbeitet werden können. Das System nutzt dabei eine zweigeteilte Architektur: Ein Modul ist auf die reine Klangqualität und die Charakteristik der Stimmen spezialisiert, während ein zweites Modul den Inhalt und die Bedeutung des Gesprächs analysiert. Als technische Basis dient das Sprachmodell Qwen2.5, das für die Steuerung komplexer Dialoge zuständig ist. Diese Kombination erlaubt es der KI, nicht nur Text in Sprache umzuwandeln, sondern auch die Dynamik einer echten Unterhaltung mit mehreren Teilnehmern nachzubilden. Flüssige Sprecherwechsel, realistische Pausen und kontextabhängige Betonungen entstehen dabei automatisch. + Quelle: Microsoft Emotionen, Gesang und klare Regeln VibeVoice überzeugt in Demonstrationen mit beeindruckender Vielseitigkeit. Die KI kann Emotionen in die Stimmen legen, spontan zwischen Sprachen wie Englisch und Chinesisch wechseln oder sogar kurze Gesangspassagen einfügen. In einem Beispiel generierte das System ein 93-minütiges Gespräch über den Klimawandel, in dem vier simulierte Sprecher natürlich miteinander diskutieren, ihre Meinungen austauschen und sogar emotionale Reaktionen zeigen. Microsoft veröffentlicht VibeVoice als Open-Source-Projekt, um die Forschung in diesem Bereich voranzutreiben. Gleichzeitig ist sich das Unternehmen der Missbrauchsrisiken bewusst und hat entsprechende Schutzmaßnahmen integriert. Jede von VibeVoice erzeugte Audiodatei enthält sowohl einen hörbaren Hinweis auf ihren künstlichen Ursprung als auch ein unsichtbares digitales Wasserzeichen. Damit positioniert sich Microsoft klar im Rennen um die fortschrittlichste Sprachsynthese, auch wenn der Wettbewerb hart umkämpft bleibt. Beispiele: Spontane Emotionen, Spontanes Singen, Podcast Your browser does not support the audio element. Your browser does not support the audio element. Your browser does not support the audio element. MITMACHEN Hat Dir der Beitrag gefallen oder geholfen? Dann hilf uns mit einem Klick weiter – dauert nur Sekunden. Teile diesen Beitrag Folge uns auf Social Media Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt KI-Tools sind teuer – unser Wissen bleibt kostenlos. Spende einmalig via PayPal oder werde YouTube-Mitglied (ab 0,99 €). Dafür liefern wir täglich News, ehrliche Tests und praxisnahe Anleitungen. Danke dir! PayPal – Spende Youtube – ABO KURZFASSUNG Microsoft hat mit VibeVoice einen Durchbruch in der KI-Sprachsynthese erzielt und kann erstmals 90-Minuten-Gespräche mit vier Sprechern in einem Durchgang generieren. Ein revolutionärer Speech Tokenizer arbeitet 80-mal effizienter als bisherige Verfahren und ermöglicht die Verarbeitung sehr langer Gespräche im Arbeitsspeicher. Das Open-Source-System übertrifft etablierte Konkurrenten wie Google Gemini und ElevenLabs in Tests zu Natürlichkeit und Ausdrucksstärke der generierten Sprache. Der globale Markt für KI-Sprachgeneratoren soll von 4,9 Milliarden Dollar 2024 auf 54 Milliarden Dollar 2033 anwachsen, was die wachsende Bedeutung der Technologie unterstreicht. QUELLEN The Decoder The Decoder English Cartesia AI Hugging Face Tribe AI

  • Schluss mit dem Foto-Chaos

    Ein Microsoft Laptop mit KI Gehirn und Fotos

    Schluss mit dem Foto-Chaos Microsofts neue KI räumt Ihre Bilder automatisch auf – doch es gibt einen Haken, den Sie kennen sollten. Kurzfassung | Andreas Becker, 28.09.25
    gpt-image-1 | All-AI.de EINLEITUNG Digitale Fotosammlungen gleichen oft einer unaufgeräumten Schublade. Neben Urlaubsbildern und Familienfotos sammeln sich unzählige Screenshots, abfotografierte Rechnungen und Notizen an. Dieses Durcheinander macht es schwer, den Überblick zu behalten. Microsoft will dieses weit verbreitete Problem nun mit einer neuen KI-Funktion in der Photos-App für Windows 11 lösen. Diese sortiert Bilder automatisch und verspricht, das digitale Chaos ohne Zutun des Nutzers zu bändigen. NEWS Intelligenter Helfer arbeitet im Hintergrund Die neue Funktion nennt sich „Auto-Kategorisierung“ und analysiert den Inhalt von Bilddateien selbstständig. Dabei erkennt die künstliche Intelligenz, ob es sich um einen Screenshot, einen Beleg, ein Ausweisdokument oder um handschriftliche Notizen handelt. Anschließend ordnet die Anwendung die erkannten Bilder automatisch in entsprechende Ordner ein, die in der Navigationsleiste der App unter einem neuen Reiter namens „Kategorien“ erscheinen. Ein wesentlicher Vorteil liegt in der lokalen Verarbeitung. Alle Analysen finden direkt auf dem Computer statt, wodurch keine persönlichen Fotos in eine Cloud hochgeladen werden müssen. Das schützt die Privatsphäre der Nutzer. Zudem arbeitet das System sprachunabhängig. Ein deutscher Reisepass wird genauso zuverlässig als Ausweisdokument erkannt wie ein ungarischer, selbst wenn die Systemsprache auf Englisch eingestellt ist. + Quelle: Microsoft / theVerge Exklusiv für die neue PC-Generation Vorerst bleibt die automatische Sortierfunktion den sogenannten Copilot+ PCs vorbehalten. Diese Geräte sind mit besonders leistungsfähigen Prozessoren und speziellen NPUs (Neural Processing Units) ausgestattet, die mindestens 40 Billionen Rechenoperationen pro Sekunde bewältigen. Diese spezialisierte Hardware ermöglicht die aufwendige KI-Analyse direkt auf dem Gerät, ohne auf externe Server angewiesen zu sein. Die Funktion wird aktuell an Nutzer im Windows-Insider-Programm verteilt, die eine Photos-App in der Version 2025.11090.25001.0 oder neuer verwenden. Anwender haben die Möglichkeit, die von der KI getroffenen Zuordnungen manuell zu korrigieren. Dieses Feedback hilft Microsoft, die Algorithmen weiter zu trainieren und die Erkennungsgenauigkeit für die Zukunft zu verbessern. Fokus auf praktische Alltagsanwendungen Mit diesem Schritt konzentriert sich Microsoft auf KI-Anwendungen, die konkrete Alltagsprobleme lösen. Anstatt nur auf spektakuläre generative Modelle zu setzen, wird die Technologie hier genutzt, um eine alltägliche Aufgabe zu vereinfachen. Die automatische Kategorisierung ist dabei nur ein Teil einer ganzen Reihe von KI-Verbesserungen für Windows, zu denen auch eine intelligente Bildbearbeitung oder die automatische Freistellung von Objekten gehören. Die Beschränkung auf vier Kategorien ist vermutlich nur der Anfang. Es ist denkbar, dass Microsoft die Funktion in Zukunft um weitere Kategorien oder sogar benutzerdefinierte Sortierregeln erweitert. Wann das Feature für alle Windows-11-Nutzer verfügbar sein wird, ist noch unklar, doch der Ansatz zeigt deutlich, wohin die Reise geht: Die KI wird zu einem unauffälligen, aber nützlichen Helfer im digitalen Alltag. MITMACHEN Hat Dir der Beitrag gefallen oder geholfen? Dann hilf uns mit einem Klick weiter – dauert nur Sekunden. Teile diesen Beitrag Folge uns auf Social Media Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt KI-Tools sind teuer – unser Wissen bleibt kostenlos. Spende einmalig via PayPal oder werde YouTube-Mitglied (ab 0,99 €). Dafür liefern wir täglich News, ehrliche Tests und praxisnahe Anleitungen. Danke dir! PayPal – Spende Youtube – ABO KURZFASSUNG Microsoft testet eine KI-gestützte Auto-Kategorisierung in der Windows 11 Photos-App, die Screenshots, Belege, Ausweisdokumente und Notizen automatisch in eigene Ordner sortiert. Die Funktion steht zunächst nur Windows 11 Insidern mit Copilot+ PCs zur Verfügung und arbeitet komplett lokal auf dem Gerät. Das System erkennt Bildtypen sprachunabhängig und ermöglicht manuelle Korrekturen zur Verbesserung der KI-Genauigkeit. Microsoft plant weitere KI-Features für die Photos-App und könnte die Kategorien in Zukunft erweitern oder benutzerdefinierte Sortierkriterien ermöglichen. QUELLEN The Verge Windows Insider Blog Nerdtime BleepingComputer Börse Express