Tag
#multimodal
3 articles sur ce sujet.

Intermédiaire2 min·10 mai 2026
Gemini File Search devient multimodal : cherche des images par vibe
Gemini File Search traite maintenant images et texte ensemble. Tes apps peuvent enfin chercher une image par son ambiance, pas juste par son nom.
#gemini-api#rag#multimodal
Avancé3 min·28 avril 2026
NVIDIA Nemotron 3 Nano Omni : l'IA qui comprend texte, image, vidéo et audio
Un modèle open-source qui traite documents, vidéos et audio en natif, 9x plus rapide que ses concurrents.
#multimodal#open-weights#document-analysis
Avancé3 min·23 avril 2026
Gemma 4 VLA sur Jetson Orin : l'IA qui décide seule d'ouvrir les yeux
Un modèle IA multimodal tourne localement sur une carte 8 GB et choisit tout seul si elle doit voir pour te répondre.
#gemma#vla#jetson