Intermédiaire·2 min·9 juin 2026

Apple Siri IA : vision LLM et calcul chiffré, enfin du concret

🎧 Résumé audio0:00 / 0:00

Apple déploie Siri avec des modèles Gemini maison et vision LLM pour lire ton écran — sans forcer les applis à se réinventer.

Pourquoi ça compte pour toi

Après le fiasco des promesses Apple Intelligence de 2024, voilà une approche technique crédible : utiliser la vision par LLM pour comprendre ce qu'il y a sur l'écran évite d'attendre que chaque appli se dote de code sur mesure. Et pour les devs, la nouvelle Core AI library + extensions PyTorch veulent enfin ouvrir l'accès au matériel Apple pour tes propres modèles — chose impossible avant.

Ce qu'il faut retenir

1.Siri repose sur un modèle Gemini personnalisé tournant sur Private Cloud Compute (Google Cloud + GPU NVIDIA, pas uniquement Apple silicon)
2.Vision LLM : l'IA lit directement ton écran pour en extraire l'information, sans avoir besoin d'intégrer chaque appli une par une
3.Core AI PyTorch Extensions : pont Python entre PyTorch et le matériel Apple, enfin accessible aux devs indépendants

Tu galères avec le jargon ?

Lis la version réécrite en mode débutant — toutes les idées, sans le jargon.

Ce qui change vraiment

Apple joue une carte différente cette fois. Au lieu de crier « révolution » et d'annoncer des fonctionnalités qui arrivent 18 mois plus tard (ou jamais), la boîte à la pomme expose une pile technique cohérente et testable dès aujourd'hui.

Le Siri nouvelle génération tourne sur des modèles Gemini que Google et Apple ont co-développés. L'astuce ? Plutôt que d'obliger chaque appli (Gmail, Photos, Notes...) à coder une intégration sur mesure avec Siri, Apple utilise des vision LLMs. L'IA regarde simplement ce qu'il y a sur ton écran et comprend le contexte. C'est efficace et ça contourne le problème de coordination avec des milliers de développeurs.

L'infra cachée : Private Cloud Compute

Nouveau dans l'annonce : les tâches complexes (raisonnement, appels à outils multiples) tournent en partie sur Google Cloud avec des GPU NVIDIA, pas uniquement sur l'infra Apple. C'est un pivot : Apple reconnaît que ses puces (chips M-series) ne suffisent pas seules pour de l'inférence lourde à faible latence.

Mais — et c'est critique — Apple affirme que les protections de sécurité restent intactes : isolement réseau, clés attestées, binaires publiés pour inspection. À croire ou pas, selon ton niveau de confiance en Apple post-2024.

Pour les devs : Core AI et PyTorch

La vraie nouveauté technique pour toi, c'est Core AI PyTorch Extensions. Enfin, un pont Python sérieux entre ton code PyTorch et le matériel Apple.

Avant, tu exportais ton modèle et tu frappais à une porte fermée. Maintenant :

▸Exporte ton modèle en torch.export.ExportedProgram
▸Utilise coreai-torch pour le mapper sur Core AI
▸C'est prêt à tourner sur iPhone, iPad, Mac

C'est modeste mais concret. Et c'est ouvert aux indépendants, pas réservé aux équipes internes Apple.

Le test du réel

La vraie question : ça marche comment en pratique ? Aaron Perris (MacRumors) a déjà accès via la liste d'attente bêta. On devrait avoir des retours crédibles d'ici quelques semaines. Pas de promesses en l'air, du code qui tourne sur ton téléphone : c'est là qu'on saura si Apple a tiré les leçons de 2024.

Et concrètement pour toi ?

Choisis ton profil — la lecture de l'article change selon qui tu es.

🔭 Curieux

Pour toi, retiens que Apple stopperait enfin de promettre et deliver du tangible : une IA qui voit ton écran c'est plus utile qu'une IA qui attend que tout le web se réinvente. C'est un modèle de design IA pragmatique qu'on va certainement voir copier partout.

Essayer maintenant

Installer iOS 27 Developer Beta et patienter sur la liste d'attente →

Source