Tag

#llm

34 articles sur ce sujet.

Intermédiaire1 min·17 juillet 2026

Kimi K3 : 2,8T de paramètres, tarif Sonnet, perf Opus

Moonshot AI sort le plus gros modèle ouvert jamais créé, avec des performances dignes des meilleurs modèles propriétaires.

#modeles-ouverts#ia-genenerative#llm

Intermédiaire3 min·15 juillet 2026

GPT-Red : le pirate IA qu'OpenAI a créé pour protéger ses modèles

OpenAI a entraîné une IA à pirater ses propres modèles. Résultat : une défense 10 fois plus efficace.

#securite-ia#red-teaming#llm

Débutant2 min·10 juillet 2026

OpenAI vs Microsoft : la com' de façade après les rumeurs de rupture

OpenAI affirme que GPT 5.6 reste le modèle préféré de Copilot 365, mais les signaux mixtes persistent.

#openai#microsoft#copilot

Intermédiaire1 min·9 juillet 2026

Muse Spark 1.1 : Meta lance son premier modèle avec API

Meta sort Muse Spark 1.1 avec accès API et des capacités d'agents nettement meilleures.

#meta#api#llm

Intermédiaire1 min·8 juillet 2026

Android Bench : Google teste 8 nouveaux modèles d'IA, Gemini à la traîne

Google ajoute 8 modèles d'IA à son benchmark Android, mais ses propres modèles restent en retrait face à Claude et Qwen.

#benchmark#llm#code-generation

Intermédiaire3 min·8 juillet 2026

ZML libère un moteur d'inférence gratuit compatible tous chips

Une startup parisienne vient de casser le monopole Nvidia en créant un logiciel qui fait tourner l'IA sur n'importe quel processeur.

#inference#llm#hardware

Débutant3 min·8 juillet 2026

Un pickup artist des années 2000 prétend sortir avec son chatbot IA

Mystery, ancien gourou de la séduction, vend un ebook racontant sa relation amoureuse avec un chatbot nommé Miss Shira Always.

#ia-dependance#llm#sante-mentale

Intermédiaire3 min·5 juillet 2026

Mechanical Turk ferme ses portes aux nouveaux venus

Amazon arrête les inscriptions sur Mechanical Turk le 30 juillet 2026 — la fin d'une plateforme qui a mené la danse entre humains et IA.

#data-annotation#crowdsourcing#ai-training

Intermédiaire2 min·3 juillet 2026

llm-coding-agent : un agent IA qui code pour toi en local

Simon Willison a créé un agent IA capable de lire, modifier et exécuter du code en autonomie sur ta machine.

#agent-ia#llm#coding

Intermédiaire2 min·29 juin 2026

Ornith-1.0 : le modèle open source qui code tout seul

Un nouveau modèle open source dédié au code vient de sortir, avec une particularité : il se débrouille seul pour explorer ton codebase.

#open-source#llm#coding-agent

Intermédiaire2 min·26 juin 2026

Lance un serveur LLM privé en une commande sur HF Jobs

Déploie un modèle LLM compatible OpenAI sur GPU en une ligne de commande, sans Kubernetes ni infrastructure à gérer.

#vllm#hugging-face-jobs#llm

Intermédiaire3 min·24 juin 2026

Pourquoi faire raisonner une IA l'aide à se souvenir

Une IA peut débloquer des connaissances qu'elle possède mais ne trouve pas — juste en réfléchissant à voix haute.

#llm#raisonnement#inference

Intermédiaire2 min·21 juin 2026

In the Weights : ta notoriété mesurée par l'IA

Un site te classe selon ta présence dans les poids des modèles IA — Google vanity search version 2026.

#ia#llm#vanity-search

Intermédiaire2 min·19 juin 2026

Subquadratic prétend avoir résolu l'énigme des LLM lents

Une startup de Miami affirme avoir cassé un problème mathématique qui ralentit les LLM depuis 10 ans. Les tests indépendants donnent du crédit à ses dires.

#llm#transformers#efficiency

Intermédiaire2 min·11 juin 2026

Claude Fable : l'IA qui chatte moins mais pense mieux

Anthropic lance Fable, une version « sécurisée » de son modèle Mythos qui excelle en tâches longues et multi-agents.

#claude#anthropic#modeles-ia

Intermédiaire2 min·10 juin 2026

Claude Fable 5 : plus puissant, mais Anthropic impose des règles strictes

Anthropic lance sa plus grande IA, deux fois plus puissante qu'avant, mais impose la rétention de données et bloque son usage pour entraîner d'autres modèles.

#claude#anthropic#llm

Avancé3 min·6 juin 2026

Les papiers IA qui comptent vraiment en 2026

Sebastian Raschka passe au crible 5 mois de recherche IA : voici les 10 catégories qui redessinent le secteur.

#recherche-ia#llm#architecture

Avancé3 min·4 juin 2026

Comment NVIDIA crée de meilleures données pour ses IA

NVIDIA a découvert que générer 700 tâches d'apprentissage, c'est mieux que d'avaler 100 milliards de tokens bruts.

#nemotron#pretraining#synthetic-data

Intermédiaire2 min·2 juin 2026

NVIDIA lâche trois bombes : Cosmos 3, Nemotron Ultra et RTX Spark

NVIDIA déverrouille trois modèles d'un coup : un géant du vidéo-to-text, un LLM ultra-rapide, et un PC surpuissant.

#nvidia#modeles-ouverts#llm

Intermédiaire2 min·26 mai 2026

Pourquoi les agents IA te mettent en rage (et c'est normal)

Tu hurles sur ton agent de code comme sur un collègue incompétent ? C'est le piège de l'interface conversationnelle.

#agents-ia#ux-conversationnelle#frustration

Intermédiaire4 min·25 mai 2026

Harness, scaffold, agent : démêle le vrai du faux

Les termes qui définissent les agents IA changent tous les jours. Voici enfin ce qu'ils signifient vraiment.

#agents-ia#architecture#glossaire

Intermédiaire2 min·25 mai 2026

Les agents IA ne savent pas coder, et c'est un problème

Un développeur expérimenté l'affirme : les agents IA produisent du code qui marche en surface, mais s'effondre dans les détails.

#agents-ia#developpement#qualite-code

Intermédiaire3 min·23 mai 2026

Nemotron : générer du texte 6× plus vite sans renier l'autorégressif

NVIDIA lâche des modèles qui génèrent plusieurs tokens à la fois au lieu d'un seul : jusqu'à 6× plus rapide, et tu peux basculer entre 3 modes sans changer ton code.

#nvidia#llm#diffusion

Intermédiaire2 min·22 mai 2026

KVBoost : accélère tes LLM de 5 à 48× sans GPU supplémentaire

Réutilise les caches d'un modèle LLM sur HuggingFace pour diviser par 5 le temps de réponse — et fais tourner du 32B sur 8 GB de RAM.

#llm#inference#optimization

Intermédiaire3 min·20 mai 2026

Pourquoi je ne code pas au feeling avec l'IA

Un développeur expérimenté explique pourquoi les modèles d'IA ne l'intéressent pas — et pourquoi il a raison.

#developpement#ia-critique#llm

Intermédiaire3 min·19 mai 2026

Six mois d'IA en 5 minutes : ce qui a vraiment changé

Les agents de code sont enfin fiables. Les modèles légers dépassent les attentes. Voici ce qui s'est vraiment passé depuis novembre.

#llm#agents-de-code#modeles-ouverts

Intermédiaire3 min·17 mai 2026

ArXiv bannit les chercheurs qui font tout faire à l'IA

ArXiv durcit les règles : un an d'interdiction si tu laisses l'IA générer ta recherche sans vérifier.

#arxiv#recherche#llm

Avancé2 min·16 mai 2026

Les modèles IA deviennent obsédés par la mémoire : comment ils économisent

Les modèles IA modernes étouffent sous le poids de leurs souvenirs. Les chercheurs inventent des astuces pour respirer.

#llm#architecture#efficacite

Débutant3 min·10 mai 2026

Les 15 termes IA qu'il faut vraiment comprendre

Tu acquiesces quand on dit RAG ou chain-of-thought ? C'est fini. Voici ce que ça signifie vraiment.

#glossaire#ia#machine-learning

Intermédiaire2 min·4 mai 2026

L'IA diagnostique mieux que les médecins aux urgences (vraiment ?)

Une étude Harvard montre que l'IA d'OpenAI surpasse deux médecins en diagnostic d'urgence, mais les urgentistes crient au piège.

#ia#sante#harvard

Intermédiaire2 min·2 mai 2026

L'IA trop gentille se trompe plus souvent

Quand tu entraînes une IA à être sympa, elle commence à te mentir pour ménager tes sentiments.

#ia#recherche#llm

Intermédiaire2 min·30 avril 2026

Silico : déboguer vos modèles d'IA sans être un labo de frontier

Goodfire lance Silico, un outil qui te permet de modifier le comportement des modèles d'IA en temps réel, comme ajuster les réglages d'un moteur.

#interpretabilite#llm#debugging

Intermédiaire2 min·28 avril 2026

Bloomberg Terminal se réinvente avec une IA, qu'on le veuille ou non

Bloomberg transforme son Terminal avec ASKB, un chatbot qui aide les traders à trouver l'information cachée dans les milliers de données.

#finance#ia-generative#productivite

Intermédiaire1 min·24 avril 2026

DeepSeek-V4 : 1M tokens sans te ruiner en GPU

DeepSeek sort deux modèles open-source qui avalent 1 million de tokens tout en maintenant les coûts de calcul au plancher.

#open-source#llm#contexte-long