Schlagwort: Podcast

  • OpenAI-Insider enthüllt: Darum scheitern KI-Agenten

    Das Schaubild wie sich KI-Agenten entwickeln

    Nano Banana

    Kurzfassung

    Quellen

    OpenAI-Mitgründer Andrej Karpathy dämpft im Dwarkesh Podcast den Hype um KI-Agenten. Er prognostiziert, dass echte, autonome KI-Agenten noch mindestens ein Jahrzehnt Entwicklungszeit benötigen. Als Hauptgründe nennt er fundamentale Defizite bei Intelligenz, Gedächtnis, Multimodalität und Selbstständigkeit. Karpathy sieht den Nutzen heutiger KI eher in spezialisierten Tools, etwa beim Coding, als in universellen Agenten.

    OpenAI – Blog X (vormals Twitter), Andrej Karpathy (offiziell) YouTube – Dwarkesh Podcast mit Andrej Karpathy t3n Heise Online

    Zehn Jahre. Diese Zahl dämpft den aktuellen Hype um künstliche Intelligenz. OpenAI-Mitgründer Andrej Karpathy äußerte in einem Podcast deutliche Zweifel am Entwicklungsstand heutiger KI-Agenten. Er sieht fundamentale Hürden, die einen echten Durchbruch noch lange verhindern werden. Der Realitätscheck für KI-Agenten Die Industrie erwartet KI-Agenten, die eigenständig komplexe, mehrstufige Aufgaben lösen. Andrej Karpathy widerspricht dieser kurzfristigen Erwartung deutlich. In einem aktuellen Podcast bezeichnete er die momentanen Fähigkeiten als „kognitiv enttäuschend“. Die Systeme seien noch weit von echter Autonomie entfernt. Der Hype suggeriert, KI-Agenten könnten bald menschliche Aufgaben komplett übernehmen. Karpathy warnt jedoch vor dieser Überschätzung. Die derzeitigen Modelle seien eher verbesserte Werkzeuge als echte, selbstständige Akteure. Für den Einsatz in kritischen Bereichen fehle ihnen die nötige Zuverlässigkeit und Planungsfähigkeit. Fehlende Intelligenz und Gedächtnis Karpathy benennt konkrete technische Defizite. Den Modellen fehle es an fundamentaler Intelligenz und echtem Verständnis. Sie könnten schlecht aus Erfahrungen lernen oder ein stabiles Gedächtnis aufbauen. Stattdessen würden sie oft in Schleifen scheitern oder einfache Fehler wiederholen. Auch die Multimodalität sei eine große Baustelle. Ein echter Agent müsse seine Umgebung wahrnehmen und Aktionen ableiten. Aktuelle Systeme seien meist auf Text beschränkt. Die Integration von Sehen, Hören und Handeln funktioniere noch nicht robust genug für autonome Einsätze. Spezialisierte Tools statt Universalagenten Der OpenAI-Experte unterscheidet klar zwischen universellen Agenten und spezialisierten Tools. Letztere sieht er positiv. Besonders beim Programmieren seien KI-Werkzeuge schon heute sehr nützlich. Sie agieren dort als fähige Assistenten, nicht als autonome Entwickler. Diese spezialisierten Helfer können repetitive Aufgaben im Code übernehmen. Sie sind aber auf einen engen, klar definierten Bereich beschränkt. Der Sprung zu einem universellen Agenten, der beliebige Ziele in einer komplexen Umgebung verfolgt, sei gewaltig. Karpathy rechnet deshalb erst im kommenden Jahrzehnt mit einem echten Durchbruch.

  • OpenAIs KI soll tagelang denken können

    Ein OpenAi Roboter arbeitet 24 Stunden

    OpenAIs KI soll tagelang denken können OpenAI entwickelt Modelle, die nicht in Sekunden, sondern über Stunden und Tage arbeiten. Wird KI so zum echten Forscher? Kurzfassung | Andreas Becker, 16.08.25
    gpt-image-1 | All-AI.de EINLEITUNG Sprachmodelle liefern heute in Sekunden eine Antwort. Doch das reicht OpenAI nicht mehr. Das Unternehmen arbeitet an KI-Systemen, die über viele Stunden oder sogar Tage an komplexen Aufgaben tüfteln können. Im hauseigenen Podcast beschreibt Forschungschef Jakub Pachocki, wohin die Reise geht: hin zu KI, die plant, testet, scheitert und von vorne beginnt. Was bringt diese neue Denkweise? NEWS KI soll planen, verwerfen und neu ansetzen Bisher funktionieren KI-Modelle wie eine schnelle Hilfe: eine Frage, eine Antwort. Doch je komplexer die Aufgabe, desto klarer zeigt sich das Limit. Mehrschrittige Probleme mit Zwischenergebnissen, Schleifen oder fehlgeschlagenen Versuchen überfordern heutige Systeme schnell. OpenAI will das ändern – mit Modellen, die über längere Zeiträume hinweg durchhalten. Dazu braucht es mehr als nur Rechenpower. Denkprozesse müssen koordiniert ablaufen. Ein KI-Agent plant, andere führen aus. Ergebnisse werden überprüft, bevor es weitergeht. Diese Orchestrierung erlaubt es der KI, wie ein Projektleiter zu handeln – strukturiert, mit klaren Zielen und dokumentierten Entscheidungen. Statt direkt zur Lösung zu springen, geht es ums Nachdenken im Prozess.

    Wettkampferfolge als Testfeld Ein Vorgeschmack auf diese Strategie zeigt sich bei Mathe-Wettbewerben. OpenAI und DeepMind konnten auf dem Niveau von Olympiagewinnern mithalten. Solche Aufgaben brauchen nicht nur Wissen, sondern Ausdauer und logische Planung – Eigenschaften, die genau zu langfristig denkenden Modellen passen. Auch beim Programmieren zeigte ein Modell von OpenAI, was möglich ist. In einem zehnstündigen Wettbewerb blieb es fast bis zum Ende auf Augenhöhe mit dem menschlichen Champion. Das zeigt: Langfristige Denkstrategien greifen bereits. Aber es bleibt Luft nach oben – etwa bei spontanen Einfällen oder flexiblen Anpassungen während des Wettkampfs. Forschung als Endziel Das langfristige Ziel: Forschung automatisieren. In Bereichen wie Medizin, Materialentwicklung oder KI-Sicherheit könnten solche Systeme eigenständig neue Ideen finden, Daten analysieren und ihre eigenen Versuchspläne anpassen. Nicht durch Zufallstreffer, sondern durch strukturiertes Arbeiten über viele Stunden hinweg. Allerdings ist der Preis hoch. Solche Denkprozesse kosten Zeit, Energie und viel Rechenleistung. Deshalb arbeitet OpenAI an klar definierten Zeitbudgets, Qualitätskontrollen und Mechanismen, die auch nach Tagen noch nachvollziehbar machen, wie eine Entscheidung zustande kam. Denkbar ist, dass Nutzer künftig Aufgaben anstoßen und später umfassend dokumentierte Ergebnisse abrufen – mitsamt Fehlerwegen und Alternativen. DEIN VORTEIL – DEINE HILFE Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung. Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube – Kanal PayPal – Kaffee KURZFASSUNG
    OpenAI arbeitet an KI-Modellen, die über Stunden oder Tage hinweg an komplexen Aufgaben denken und arbeiten können.
    Die Systeme sollen Teilziele setzen, Strategien wechseln und Ergebnisse iterativ überprüfen, ähnlich wie menschliche Forscher.
    Erste Tests in Mathe- und Programmierwettbewerben zeigen bereits vielversprechende Ansätze mit Ausdauerpotenzial.
    Der neue Ansatz erfordert deutlich mehr Rechenzeit und neue Metriken für langfristige Zuverlässigkeit und Qualität.
    QUELLEN
    OpenAI Podcast – YouTube
    OpenAI Podcast – Apple Podcasts
    OpenAI Podcast – Übersicht
    The Guardian