Économie multi-agents sur 3B paramètres : quand l'IA joue au marché
Pourquoi ça compte pour toi
Ça démontre qu'un modèle 3B peut orchestrer des systèmes multi-agents complexes en temps réel—sans passer par GPT-4. Et ça révèle comment les petits modèles excellent à formater (100% JSON valide) mais déraillent au raisonnement : une leçon applicable à tout agent d'IA que tu construis. Enfin, c'est une preuve que la vraie magie ne vient pas du modèle, mais du design des contraintes.
Ce qu'il faut retenir
- 1.5 créatures traders échangent 5 biens sur Qwen2.5-3B ; le modèle génère du JSON valide dans 100% des cas
- 2.Sans rareté artificielle, l'économie reste morte—périssabilité des aliments, rationnement alimentaire et crises hivernales forcent les échanges réels
- 3.Le petit modèle raisonne mal (achète ce qu'il vend déjà) : la solution = prompts plus pointus, pas un modèle plus gros
- 4.Les prix bougent quand on les détache de la référence initiale ; une rumeur de faillite peut faire chuter le miel de 10 à 3 en quelques tours
- 5.L'écart de richesse (Gini) passe de 0.14 à 0.38 en 15 tours ; le bûcheron devient riche, le thésauriseur s'effondre
Tu galères avec le jargon ?
Lis la version réécrite en mode débutant — toutes les idées, sans le jargon.
Pourquoi petit = plus rapide pour les agents
Une économie vivante a besoin de nombreux agents pensant plusieurs fois par exécution. C'est exactement le cas où un modèle frontier explose ton budget et ta latence. Avec Qwen2.5-3B servi via vLLM sur Modal, chaque créature décide en un seul appel GPU par tour. 15 tours, 5 agents, c'est 75 appels—faisable en secondes. Avec Claude ? tu attends.
L'économie morte et la leçon de rareté
La première version a échoué. La production surpassait la consommation. Chaque créature était autosuffisante. Zéro échange.
La solution ? Concevoir la rareté :
- ▸Chaque créature ne peut manger qu'une unité d'un même aliment par repas → elle doit en acheter ce qu'elle ne cultive pas
- ▸Les aliments périssables pourrissent s'ils sont thésaurisés → vends-les tant qu'ils ont de la valeur
- ▸Une crise hivernale : toute créature brûle du bois chaque tour, la demande monte, mais un seul agent produit du bois → le bûcheron devient riche
Le truc le plus violent ? Aucune de ça n'était codé en dur. Juste des règles de mécanique.
JSON valide, raisonnement faible : la promesse du 3B
100% des réponses sont du JSON syntaxiquement correct. Mais écoute ça : une créature qui cultive des glands postait une demande d'achat de glands—la seule chose qu'elle avait en surplus.
La réponse ne fut pas un modèle plus gros. C'est un prompt plus aigu :
- ▸"Tu cultives ça, tu n'en achèteras jamais ça"
- ▸Calcule sa liste exacte de biens en pénurie
- ▸Un exemple travaillé
La qualité des décisions a décollé. Les créatures ont commencé à échanger réellement.
Bonus : une couche de réparation JSON tolérante transforma les réponses malformées en no-ops au lieu de faire planter la simulation.
Les prix qui bougent
Au départ, les agents cotaient la référence de prix qu'on leur montrait. Les prix ne bougeaient jamais. Mort du marché.
La correction : laisser la référence de marché dériver avec l'offre et la demande résiduelles après chaque tour. Beaucoup d'ordres d'achat non remplis ? le prix monte. Un surplus d'offre ? il dégringole.
Résultat : en une seule légende injectée (la "Run on Oona's Hoard"—une ruée bancaire glissée dans un folklore forestier), la chouette a liquidé du miel pour lever des galets, inondant le marché. Prix du miel : 10 → 3 en trois tours. Rien de scripté. Rien d'artificiel.
Ce qui s'est passé en 15 tours
Eau en pénurie, rumeur hivernale injectée :
- ▸100% des actions en JSON valide (75 sur 75)
- ▸3–9 échanges par tour (jamais silence)
- ▸Miel : chute de 10 à 3 pendant la ruée
- ▸Bois : hausse de 4 à 7 lors de la pénurie hivernale
- ▸Indice Gini (inégalité) : 0.14 → 0.38
- ▸Le bûcheron termine riche, le thésauriseur ruiné
Chaque décision laisse ses traces ouvertes : prompt brut, réponse brute, actions parsées, pensée privée.
À retenir pour construire avec un petit modèle
L'essentiel du travail consiste à combler le fossé entre la fiabilité de formatage du 3B et sa faiblesse au raisonnement. Pas avec de l'échelle. Avec de la structure et des prompts.
Les systèmes émergents ont besoin de rareté dessinée à la main. L'abondance, c'est ennuyeux.
Et les démos multi-agents les plus convaincantes ne fabriquent pas le drama. Trois siècles d'histoire des marchés le fournissent gratuitement. Un groupe de 5 agents 3B, c'est assez pour le rejouer.
Et concrètement pour toi ?
Choisis ton profil — la lecture de l'article change selon qui tu es.
Pour toi, retiens que même une petite IA peut créer un système complexe et imprévisible (des krachs, des inégalités qui montaient toutes seules). C'est rassurant et flippant : les vrais enjeux ne sont pas l'IA qui sera trop puissante, mais l'IA qu'on laisse émerger sans règles claires.
Essayer maintenant
Expérimenter la démo interactive →Source
Pour aller plus loin
Cet article t'a donné envie d'approfondir ? Deux formations Noésis t'attendent :
Explorer les thèmes de cet article :