
Google Deepmind stattet sein Gemini-3-Flash-Modell mit einer neuen Fähigkeit namens „Agentic Vision“ aus. Das Modell soll Bilder nicht mehr nur passiv betrachten, sondern aktiv untersuchen können – allerdings funktioniert das noch nicht in allen Fällen automatisch.
Der Artikel Agentic Vision: Gemini schreibt sich jetzt eigenen Code, um Bilder besser zu verstehen erschien zuerst auf The Decoder.

