Tag
1 article sur ce sujet.
Trois nouveaux benchmarks le prouvent : même les meilleurs agents IA plafonnent à 2,6% de réussite sur des tâches réelles.