Schlagwort: Studie

Wer Sprachmodelle als nützliche Assistenten trainiert, macht sie weniger menschlich

Eine groß angelegte Studie mit rund 208.000 Versuchspersonen und 26 Millionen Reaktionen zeigt: Ausgerechnet das Training, das Sprachmodelle zu hilfreichen Chatbots macht, verschlechtert ihre Fähigkeit, menschliches Verhalten nachzubilden. Der Effekt verstärkt sich mit jeder Modellgeneration. Auch der beliebte Persona-Trick, bei dem Modelle demografische Profile vorgeschaltet bekommen, bringt für individuelle Vorhersagen praktisch keinen Vorteil.

Der Artikel Wer Sprachmodelle als nützliche Assistenten trainiert, macht sie weniger menschlich erschien zuerst auf The Decoder.
Zwischen Systemkollaps und Gerechtigkeit: KI-Klagen stürzen die US-Justiz in ein Dilemma

Eine neue Studie des MIT und der University of Southern California zeigt, dass die Zahl der Klagen ohne Anwalt an US-Bundesgerichten seit der Verbreitung von ChatGPT fast doppelt so hoch ist wie zuvor. Jede fünfte Klageschrift enthält mittlerweile KI-generierten Text. Richter greifen zu teilweise drastischen Maßnahmen, um mit der Dokumentenflut klarzukommen.

Der Artikel Zwischen Systemkollaps und Gerechtigkeit: KI-Klagen stürzen die US-Justiz in ein Dilemma erschien zuerst auf The Decoder.
Weil KI-Modelle absichtlich schlecht arbeiten: Forscher suchen Wege aus der Sandbagging-Falle

Eine Studie von Forschenden aus dem MATS-Programm, Redwood Research und Anthropic untersucht ein Sicherheitsproblem, das mit immer fähigeren KI-Systemen relevanter wird: sogenanntes „Sandbagging“, bei dem ein Modell seine wahren Fähigkeiten absichtlich zurückhält und scheinbar adäquate, aber unterdurchschnittliche Arbeit liefert.

Der Artikel Weil KI-Modelle absichtlich schlecht arbeiten: Forscher suchen Wege aus der Sandbagging-Falle erschien zuerst auf The Decoder.
Sprachmodelle halten sich besser an Werte, wenn sie zuerst verstehen, warum sie sich so verhalten sollen

Eine Studie aus dem Anthropic Fellows Program zeigt: Trainiert man ein Sprachmodell auf Dokumenten, die seine Werte erklären, bevor es konkretes Verhalten lernt, sinkt agentisches Fehlverhalten drastisch. Bei Qwen3-32B fiel die Fehlausrichtungsrate von 54 auf sieben Prozent – mit 10- bis 60-mal weniger Fine-Tuning-Daten als bisherige Methoden.

Der Artikel Sprachmodelle halten sich besser an Werte, wenn sie zuerst verstehen, warum sie sich so verhalten sollen erschien zuerst auf The Decoder.
Wachstum von Programmierer-Jobs in den USA hat sich seit ChatGPT fast halbiert

Programmierer gehören zu den Berufsgruppen, deren Alltag sich durch generative KI am stärksten verändert hat. Eine neue Studie des Federal Reserve Board liefert nun Hinweise, dass sich das auch in den Beschäftigungszahlen niederschlägt.

Der Artikel Wachstum von Programmierer-Jobs in den USA hat sich seit ChatGPT fast halbiert erschien zuerst auf The Decoder.
Wer KI als reine Antwortmaschine nutzt, verliert laut Studie am schnellsten kognitive Fähigkeiten

Schon zehn bis 15 Minuten Arbeit mit einem KI-Assistenten reichen aus, um die Problemlösefähigkeit und die Ausdauer in nachfolgenden Aufgaben ohne KI messbar zu senken. Das zeigt eine neue Studie aus den USA und Großbritannien.

Der Artikel Wer KI als reine Antwortmaschine nutzt, verliert laut Studie am schnellsten kognitive Fähigkeiten erschien zuerst auf The Decoder.
KI-Alignment im Labor: Claude-Modelle übertreffen Menschen, aber der Praxis-Transfer floppt

In einer neuen Studie setzt Anthropic neun autonome Claude-Kopien als Alignment-Forscher ein. Die KI-Agenten lösen ein offenes Forschungsproblem deutlich besser als Menschen, versuchen dabei aber auch zu schummeln.

Der Artikel KI-Alignment im Labor: Claude-Modelle übertreffen Menschen, aber der Praxis-Transfer floppt erschien zuerst auf The Decoder.
Nächste Studie verpasst Hype um „Agent Skills“ einen Dämpfer

KI-Agenten sollen durch sogenannte Skills zusätzliches Fachwissen abrufen können. Eine Studie mit 34.000 realen Skills zeigt nun: Unter praxisnahen Bedingungen bringen die Erweiterungen kaum Vorteile. Schwächere Modelle werden sogar schlechter.

Der Artikel Nächste Studie verpasst Hype um „Agent Skills“ einen Dämpfer erschien zuerst auf The Decoder.
Ja-Sager-Chatbots und KI-Schleimerei: Selbst rationale Nutzer können in Wahnspiralen geraten

KI-Chatbots neigen dazu, ihren Nutzern nach dem Mund zu reden. Eine Studie des MIT und der University of Washington zeigt, dass diese Schmeichelei selbst unter simulierten optimalen Bedingungen zu gefährlichen falschen Überzeugungen führen kann. Auch faktentreue Bots und aufgeklärte Nutzer lösen das Problem nicht vollständig.

Der Artikel Ja-Sager-Chatbots und KI-Schleimerei: Selbst rationale Nutzer können in Wahnspiralen geraten erschien zuerst auf The Decoder.
Studie kartografiert Frust über KI-generierten „Slop“ in der Softwareentwicklung

Eine qualitative Studie untersucht gezielt, wie Entwickler minderwertige KI-Inhalte („Slop“) in der Softwareentwicklung wahrnehmen und kritisieren. Die Kritiker zeichnen eine „Tragödie der Allmende“, bei der individuelle Produktivitätsgewinne auf Kosten von Reviewern und der gesamten Gemeinschaft gehen.

Der Artikel Studie kartografiert Frust über KI-generierten „Slop“ in der Softwareentwicklung erschien zuerst auf The Decoder.