Intermédiaire·2 min·2 juin 2026

NVIDIA lâche trois bombes : Cosmos 3, Nemotron Ultra et RTX Spark

🎧 Résumé audio0:00 / 0:00

NVIDIA déverrouille trois modèles d'un coup : un géant du vidéo-to-text, un LLM ultra-rapide, et un PC surpuissant.

Pourquoi ça compte pour toi

Cosmos 3 unifie enfin langage, image, vidéo, audio et action dans une archi Mixture-of-Transformers — plus un open-weights qui surpasse Nano Banana 2 sur la génération d'images et vidéos. Nemotron 3 Ultra (550B paramètres, seulement 55B actifs) devient le LLM open-weights le plus rapide des États-Unis. RTX Spark, c'est ta machine locale pour faire tourner des agents IA sans cloud. Concrètement : les outils pour construire sans dépendre d'OpenAI ou Anthropic existent maintenant.

Ce qu'il faut retenir

1.Cosmos 3 : deux tailles (16B Nano, 64B Super), meilleur de sa catégorie sur la génération image/vidéo en open-weights
2.Nemotron 3 Ultra : 550B avec activation partielle (55B actifs), le LLM open-weights le plus rapide des États-Unis
3.RTX Spark : PC avec 1 pétaflop, partenaires Microsoft, OpenClaw, Nous Research pour lancer les agents en local

Tu galères avec le jargon ?

Lis la version réécrite en mode débutant — toutes les idées, sans le jargon.

Cosmos 3 : le modèle qui regarde et génère

Jusqu'à présent, tu avais des modèles spécialisés : un pour la vidéo, un pour l'image, un pour le texte. Cosmos change ça. Une seule archi (Mixture-of-Transformers) qui combine :

▸Un raisonneur autorégressif : il pense, comprend le contexte
▸Un générateur par diffusion : il crée, produit le résultat

Deux modèles open-weights au menu :

▸Nano (16B) : léger, tourne sur une machine ordinaire
▸Super (64B) : plus puissant, vraiment compétitif

Les versions affinées Text2Image et Image2Video sont désormais au sommet de leur catégorie parmi les modèles accessibles (open-weights). Juste en dessous de Nano Banana 2, mais tu peux les utiliser gratuitement.

Nemotron 3 Ultra : l'efficacité par la rareté

Nemotron 3 Ultra, c'est 550B de paramètres, mais seulement 55B s'activent à la fois (Mixture-of-Experts). Résultat : une vitesse de génération redoutable, avec une qualité au meilleur niveau américain en open-weights.

Pourquoi ça compte pour toi ? Parce que tu peux déployer un gros modèle sans payer pour faire tourner 550B complets. C'est plus rapide, moins cher en GPU.

RTX Spark : ton IA sur ta machine

C'est un PC portable slim avec un superpuce NVIDIA (1 pétaflop). Microsoft, OpenClaw et Nous Research sont partenaires au lancement.

Traduction : des agents IA qui tournent en local, sans dépendre d'une API cloud. Plus rapide, plus privé, plus contrôlé. Les créateurs et entrepreneurs qui veulent des flux de travail IA sans latence ni coûts d'API ont enfin leur outil.

Le signal réel

Ces trois annonces arrivent d'un coup. C'est pas du hasard : NVIDIA bâtit l'écosystème complet pour que tu puisses faire de l'IA sans dépendre de San Francisco. Modèles ouverts, inférence locale, hardware maison. C'est la vraie compétition à OpenAI.

Et concrètement pour toi ?

Choisis ton profil — la lecture de l'article change selon qui tu es.

🔭 Curieux

Pour toi, retiens ça : NVIDIA rend possible les systèmes IA vraiment autonomes hors du cloud (avec RTX Spark). C'est le début de la fin du monopole des géants — demain, un agent IA complet tourne sur ton PC, pas sur les serveurs d'OpenAI.

Essayer maintenant

Explorer NVIDIA Cosmos sur le hub →

Source