Schlagwort: KISysteme

ARC-AGI-3: Top-KI-Modelle schaffen unter 1 Prozent bei Aufgaben, die Menschen einfach lösen

Der neue Benchmark ARC-AGI-3 lässt KI-Systeme in interaktiven Spielumgebungen antreten, die Menschen mühelos meistern. Kein Frontier-Modell knackt die 1-Prozent-Marke – auch weil der Benchmark ihnen ihre größten Vorteile nimmt.

Der Artikel ARC-AGI-3: Top-KI-Modelle schaffen unter 1 Prozent bei Aufgaben, die Menschen einfach lösen erschien zuerst auf The Decoder.
Langjähriges KI-Hindernis ARC fällt durch die unaufhaltsame Optimierungsmaschinerie

Lange Zeit galt der ARC-Benchmark als nahezu unüberwindbares Hindernis für KI-Systeme und als Test für fluide Intelligenz. Neue Ergebnisse zeigen jedoch, dass selbst diese Bastion allmählich der unaufhaltsamen Optimierungsmaschinerie der KI-Labore nachgibt.

Der Artikel Langjähriges KI-Hindernis ARC fällt durch die unaufhaltsame Optimierungsmaschinerie erschien zuerst auf The Decoder.
„Teen Safety Blueprint“: OpenAI führt Jugendschutz-Regeln ein

OpenAI will mit einem „Teen Safety Blueprint“ festlegen, wie KI-Systeme Jugendliche besser schützen sollen. Die neuen Regeln kommen, nachdem ChatGPT in mehreren Fällen psychisch belastete Nutzer nicht ausreichend geschützt haben soll.

Der Artikel „Teen Safety Blueprint“: OpenAI führt Jugendschutz-Regeln ein erschien zuerst auf The Decoder.
Zwei Bücher reichen, um Sprachmodelle auf den Stil eines Autors zu trainieren

Forschende haben herausgefunden, dass KI-Systeme, die gezielt auf einzelne Schriftsteller trainiert werden, Texte produzieren, die Leser besser finden als die Imitationen professioneller Autor:innen. Das könnte Folgen für laufende Rechtsstreitigkeiten haben.

Der Artikel Zwei Bücher reichen, um Sprachmodelle auf den Stil eines Autors zu trainieren erschien zuerst auf THE-DECODER.de.
KI-Forscher Andrej Karpathy rückt die Erwartungen an agentische KI zurecht

Der frühere OpenAI- und Tesla-Forscher Andrej Karpathy sieht agentenbasierte KI-Systeme und große Sprachmodelle derzeit am Limit. Fortschritte brauche es insbesondere bei Gedächtnis, Multimodalität und Trainingsdaten.

Der Artikel KI-Forscher Andrej Karpathy rückt die Erwartungen an agentische KI zurecht erschien zuerst auf THE-DECODER.de.
Tencent veröffentlicht zwei leistungsfähige Open-Source-Übersetzungsmodelle

Das chinesische Tech-Unternehmen Tencent hat zwei spezialisierte Übersetzungsmodelle als Open Source veröffentlicht. Die KI-Systeme sollen bei einem internationalen Vergleichstest besser abschneiden als etablierte Dienste wie Google Translate.

Der Artikel Tencent veröffentlicht zwei leistungsfähige Open-Source-Übersetzungsmodelle erschien zuerst auf THE-DECODER.de.
Zukünftige KI-Systeme sollen über Stunden oder Tage an Problemen arbeiten

OpenAI will KI-Systeme entwickeln, die über Stunden oder Tage hinweg an einem Problem arbeiten können.

Der Artikel Zukünftige KI-Systeme sollen über Stunden oder Tage an Problemen arbeiten erschien zuerst auf THE-DECODER.de.
Meta entdeckt Hinweise auf selbstlernende KI und bremst Open-Source-Pläne

Meta beobachtet erste Anzeichen für selbstverbessernde KI-Systeme.

Der Artikel Meta entdeckt Hinweise auf selbstlernende KI und bremst Open-Source-Pläne erschien zuerst auf THE-DECODER.de.
Mathe-Gold für KI entfacht alte Debatte über Symbolmanipulation und echte Intelligenz

Die jüngsten Goldmedaillen für KI-Systeme von Google Deepmind und OpenAI bei der Internationalen Mathematik-Olympiade befeuern eine alte Debatte über die Natur von Intelligenz und die Rolle von Symbolen, in der Deep-Learning-Ansätze auf die klassische KI treffen.

Der Artikel Mathe-Gold für KI entfacht alte Debatte über Symbolmanipulation und echte Intelligenz erschien zuerst auf THE-DECODER.de.
Im KI-Benchmark ARC-AGI-3 zeigen Menschen, was Maschinen noch fehlt

ARC-AGI-3 soll messen, wie gut KI-Systeme unbekannte Aufgaben verstehen und lösen können. Menschen kommen mit den Tests problemlos zurecht, die KI scheitert bisher vollständig.

Der Artikel Im KI-Benchmark ARC-AGI-3 zeigen Menschen, was Maschinen noch fehlt erschien zuerst auf THE-DECODER.de.