Transformer
Définition
Architecture de réseau de neurones fondée sur le mécanisme d'attention, qui permet au modèle de comprendre les relations entre tous les mots d'un texte simultanément. Introduite en 2017, elle est devenue la base de tous les grands modèles de langage actuels comme GPT et Claude.
Quand tu écris un email, le Transformer comprend que « il » dans la phrase se rapporte à « Jean » mentionné trois lignes plus haut, pas à « Paul » de la dernière phrase.
C'est l'invention clé qui a rendu possibles ChatGPT et tous les IA modernes. Comprendre ce mot te permet de saisir pourquoi l'IA d'aujourd'hui fonctionne si différemment de celle d'hier.
Voir aussi
Articles qui en parlent
Specsmaxxing : quand les specs sauvent ton IA de la folie
Écrire des specs structurées en YAML, c'est comment transformer tes agents IA en vrais développeurs au lieu de générateurs de slop.

Uber veut transformer ses chauffeurs en capteurs pour l'IA autonome
Uber envisage d'équiper ses millions de voitures de capteurs pour vendre les données brutes aux développeurs de voitures autonomes.

Simon Willison syndique ses photos d'oiseaux sur son blog avec Claude
Un développeur ajoute ses milliers de photos d'oiseaux iNaturalist à son blog, directement depuis son téléphone, grâce à Claude Code.
Former son équipe à l'IA en 2026 : la méthode des CTO français
Former son équipe à l'IA en 2026 ne se résume pas à un webinaire : voici la méthode terrain des CTO français qui ça marche.
Comment utiliser Claude (Anthropic) en français en 2026
Claude est l'IA d'Anthropic qui mérite vraiment ton attention : voici comment en tirer le meilleur dès aujourd'hui.
NVIDIA Nemotron 3 Nano Omni : l'IA qui comprend texte, image, vidéo et audio
Un modèle open-source qui traite documents, vidéos et audio en natif, 9x plus rapide que ses concurrents.