AI-codeeragenten vinden het juiste bestand, maar missen de exacte regels die ertoe doen, blijkt uit onderzoek
AI-codeeragents zoals Claude Code of Codex vinden betrouwbaar het juiste bestand, maar missen de meeste kritieke regels erin. De nieuwe SWE-Explore-benchmark is de eerste die codezoekopdrachten los van de daadwerkelijke reparatie test, en toont aan dat zonder voldoende context zelfs de beste fix faalt.
🔗 lees originele bron