Intermédiaire·2 min·27 mai 2026

Fireworks et Baseten deviennent décacornes : l'infra IA s'accélère

🎧 Résumé audio0:00 / 0:00
Deux startups d'infra IA franchissent les 10 milliards de valorisation en quelques mois. Le signal est clair : l'inférence explose.
Fireworks et Baseten deviennent décacornes : l'infra IA s'accélère

Pourquoi ça compte pour toi

Si tu construis avec l'IA, tu dois comprendre où va le capital : c'est vers les outils qui rendent l'inférence plus rapide et moins chère. Fireworks, Baseten et OpenRouter deviennent tes fournisseurs critiques. Et comme toute course aux armements technologiques, celui qui maîtrise l'infra maîtrise le jeu.

Ce qu'il faut retenir

  • 1.Fireworks lève à 15 milliards (3,75x en 7 mois), Baseten à 11 milliards (2,2x en 3 mois)
  • 2.OpenRouter boucle 113 millions en Série C : le volume de tokens a été multiplié par 5 en 6 mois (de 5 à 25 billions par semaine)
  • 3.La tendance : accès multi-modèle + routeurs intelligents = le duo gagnant de 2026

Tu galères avec le jargon ?

Lis la version réécrite en mode débutant — toutes les idées, sans le jargon.

Pourquoi ces trois entreprises explosent maintenant

On te l'avait dit : l'infra d'inférence est devenue le nouveau terrain de jeu. Pas les modèles (c'est OpenAI, Anthropic, Qwen qui font la course). Pas les notebooks (les dev IA ont leurs outils). C'est celui qui peut faire tourner N modèles en parallèle, très vite, à coût raisonnable.

Le timing parfait

Fireworks = gestion GPU + mise en cache intelligente + multi-modèle. Baseten = orchestration pour agents + traitement par lots. OpenRouter = routeur qui choisit le meilleur modèle pour ta requête à coût optimisé.

Tu vois le schéma ? La mise en production de l'IA ne ressemble plus à "j'envoie un prompt à Claude". C'est : "je lance 3 modèles en parallèle, je compare les réponses, j'optimise le coût par cas d'usage".

Les vrais chiffres

OpenRouter est passé de 5T à 25T tokens par semaine. Multiplié par 5 en 6 mois. Ce ne sont PAS des chiffres marketing : ce sont des milliards de tokens payants qui transitent par ces tuyaux. Les startups sérieuses commencent à payer pour l'infra.

Ce que ça change pour toi

Si tu es fondateur ou CTO : tu dois tester au moins deux routeurs pour tes agents (OpenRouter + Fireworks ou une solution maison). Ne reste pas sur un seul modèle. La marge est là.

Si tu es dev qui construit des agents : l'époque du "prompt bête et méchant" est finie. Tu vas utiliser des environnements d'exécution (gouvernance du contexte, mémoire persistante, boucles de validation). Google, LangChain, DeepSeek l'ont tous dit cette semaine : le modèle représente 30% du travail, l'environnement d'exécution 70%.

Si tu choisis une stack d'infra : Baseten et Fireworks sont désormais crédibles pour la prod. OpenRouter, c'est déjà la base.

Et concrètement pour toi ?

Choisis ton profil — la lecture de l'article change selon qui tu es.

🔭 Curieux

Pour toi, retiens que l'argent qui arrive chez Fireworks et Baseten montre que l'IA se décentralise : tu n'auras bientôt plus besoin d'ChatGPT, juste des outils qui choisissent le meilleur modèle pour ta question. C'est un changement de paradigme.

Newsletters Noésis

3 minutes d'IA dans ta boîte mail, chaque matin.

Rejoins les francophones qui comprennent, essaient et progressent avec l'IA. Choisis ce que tu veux recevoir. Désabonnement en 1 clic.

Explorer les thèmes de cet article :