AI-codeeragenten vinden het juiste bestand, maar missen de exacte regels die ertoe doen, blijkt uit onderzoek

analyse 📅 2026-06-14

AI-codeeragents zoals Claude Code of Codex vinden betrouwbaar het juiste bestand, maar missen de meeste kritieke regels erin. De nieuwe SWE-Explore-benchmark is de eerste die codezoekopdrachten los van de daadwerkelijke reparatie test, en toont aan dat zonder voldoende context zelfs de beste fix faalt.

🔗 lees originele bron