Reve 2 et Ideogram 4 : la composition d'image n'est plus AGI-Hard
Pourquoi ça compte pour toi
Pendant 4 ans, la composition d'image était considérée comme « AGI-Hard » — presque impossible. Cette semaine, Reve et Ideogram percent le mystère simultanément en s'appuyant sur des boîtes de délimitation comme supervision. Pour toi créateur ou entrepreneur, ça signifie : des générateurs d'images qui comprennent enfin où placer chaque élément, sans prompt compliqué. C'est le jour où tu peux vraiment « toucher » l'image générée.
Ce qu'il faut retenir
- 1.Reve 2.0 et Ideogram 4.0 publiés le même jour avec la mise en page comme axe central
- 2.Technique clé : boîtes de délimitation + descriptions régionales pour enseigner la structure au modèle
- 3.Reve 2.0 = meilleur modèle 4K ; Ideogram 4.0 = meilleur modèle ouvert selon les classements Arena
- 4.Réduction des images en mises en page = on passe de la diffusion (coûteuse) à la prédiction du token suivant (plus efficace)
- 5.Microsoft MAI-Thinking-1 aussi publié : 97 % sur AIME 2025, sans distillation tierce, excellent en code, maths et STEM
Et concrètement pour toi ?
Choisis ton profil — la lecture de l'article change selon qui tu es.
Pour toi, deux modèles qui craquent le même problème le même jour, c'est le signal que l'IA atteint la maturité sur un domaine : la composition d'image passe de « science-fiction » à « routine ». Ça annonce quoi ensuite ? Regarde où les chercheurs disent encore « c'est impossible » — c'est probablement le prochain problème déjà résolu dans un labo, en attente de publication.
Source
Pour aller plus loin
Cet article t'a donné envie d'approfondir ? Deux formations Noésis t'attendent :
Explorer les thèmes de cet article :