Intermédiaire·3 min·14 juin 2026

Kage : sauvegarde un site entier hors ligne, sans une ligne de code

🎧 Résumé audio0:00 / 0:00
Télécharge un site complet, ôte tout le JavaScript, emballe-le en un seul fichier exécutable.
Kage : sauvegarde un site entier hors ligne, sans une ligne de code

Pourquoi ça compte pour toi

Tu as déjà perdu des pages web en « Save As » : elles deviennent blanches, cassées, ou demandent la connexion. Kage résout ça différemment : il lance un vrai navigateur, attend que la page finisse de charger, capture ce que tu vois, puis supprime tout script et récupère les images et polices en local. Résultat : des fichiers HTML purs, zéro appel réseau, zéro tracking, lisibles dans 10 ans.

Ce qu'il faut retenir

  • 1.Lance Chrome headless, attend la stabilité du DOM, efface tout JavaScript
  • 2.Trois formats de sortie : dossier local, archive ZIM (compatible Kiwix), ou exécutable autonome
  • 3.Exploration polie et idempotente : respecte robots.txt, reprend où tu as arrêté, gère http/https
  • 4.Pas de dépendances : conteneur Docker fourni, binaires précompilés pour Linux/Mac/Windows

Tu galères avec le jargon ?

Lis la version réécrite en mode débutant — toutes les idées, sans le jargon.

Pourquoi ça change la donne

Le problème est vieux : quand tu sauvegardes une page avec ton navigateur, tu gardes une coquille HTML qui dépend d'URLs en dur, de scripts externes, et d'un serveur qui peut disparaître. Kage attaque autrement.

Il lance un vrai Chrome en headless, laisse la page faire tout ce qu'elle doit faire (chargement lazy, animations, rendu JavaScript), prend une photo du DOM fini, puis détruit tout le code. Ce qui te reste : du HTML pur, du CSS local, des images et polices téléchargées. Aucun appel réseau possible. Aucun tracking.

Comment ça marche en pratique

# Clone un site entier
kage clone paulgraham.com

# Sers-le localement
kage serve ~/data/kage/paulgraham.com
# Ouvre http://127.0.0.1:8800

Tu peux aussi limiter la profondeur (50 pages max, 2 niveaux de liens) pour un test rapide :

kage clone paulgraham.com --max-pages 50 --max-depth 2

Les trois formats de sortie

1. Dossier local — Les fichiers bruts sur disque. Parfait pour naviguer, modifier, chercher.

2. Archive ZIM — Format ouvert conçu pour ça (Wikipedia l'utilise). Un seul fichier compressé, portable sur n'importe quel lecteur Kiwix (iOS, Android, bureau) :

kage pack paulgraham.com
# → paulgraham.com.zim

3. Exécutable autonome — Un seul binaire qui est le site. Tu l'envoies à quelqu'un, il le lance, c'est tout. Zéro dépendances :

kage pack paulgraham.com --format binary -o paulgraham
./paulgraham  # Lance le serveur local

Tu peux même compiler pour une autre plateforme depuis la tienne :

kage pack paulgraham.com --format binary --base kage-windows-amd64.exe
# → paulgraham.exe (construite sur Mac, exécutable sur Windows)

Les options utiles

  • --max-pages : arrête après N pages (défaut : illimité)
  • --max-depth : profondeur d'exploration (défaut : illimité)
  • --subdomains : inclut les sous-domaines du même hôte
  • --scroll : défilement automatique pour déclencher le lazy loading
  • --refresh : re-rendu sur place pour les mises à jour
  • --workers 4 : nombre de pages rendues en parallèle

L'exploration est polie : elle lit robots.txt, ne surcharge pas le serveur, et est idempotente (la même page atteinte par http/https n'est téléchargée qu'une fois).

Cas d'usage réels

  • Archiver des blogs avant qu'ils disparaissent
  • Constituer un corpus de docs hors ligne pour un avion ou un bateau
  • Partager une ressource web sans dépendre du serveur original
  • Conserver une copie octet pour octet d'un site historique (le packing est déterministe)

Limitation honnête

Le ZIM généré par Kage est structurellement valide, mais sans l'index de recherche plein texte que Kiwix construit lui-même. Tu peux naviguer et cliquer partout, mais la recherche dans le lecteur sera limitée.

Et concrètement pour toi ?

Choisis ton profil — la lecture de l'article change selon qui tu es.

🔭 Curieux

Pour toi, teste Kage sur un blog ou une doc que tu aimes : tu verras concrètement comment on « fige » le web pour le préserver, et pourquoi c'est important face à la disparition de pages et au tracking.

Approfondir avec un guide

📊 Cours en bourse

Newsletters Noésis

3 minutes d'IA dans ta boîte mail, chaque matin.

Rejoins les francophones qui comprennent, essaient et progressent avec l'IA. Choisis ce que tu veux recevoir. Désabonnement en 1 clic.

Explorer les thèmes de cet article :