Intermédiaire·3 min·6 juin 2026

Un petit modèle pour ta recherche d'emploi

🎧 Résumé audio0:00 / 0:00

Un modèle IA de 8 milliards de paramètres qui comprend ta candidature et trouve les vrais bons jobs.

Pourquoi ça compte pour toi

Chercher du boulot, c'est fastidieux : tu cliques sur 200 annonces pour en trouver 5 qui te conviennent. Cet outil montre comment entraîner un petit modèle à faire le tri intelligemment en comparant ta candidature avec les offres réelles. C'est concret pour comprendre comment construire une IA "coach recrutement" et faire passer des petits modèles à l'échelle.

Ce qu'il faut retenir

1.Deux étapes : générer les bonnes requêtes LinkedIn, puis noter chaque offre sur 5 critères (compétences, expérience, formation, secteur, niveau de séniorité)
2.Qwen3-8B finement entraîné avec des labels générés par DeepSeek V4 Pro sur 10 000 offres réelles + 2500 CV
3.Déploiement sur ZeroGPU en une seule inférence par candidature (évite les redémarrages GPU coûteux)

Tu galères avec le jargon ?

Lis la version réécrite en mode débutant — toutes les idées, sans le jargon.

Comment ça marche

Tu donnes ton CV, tes préférences (type de poste, télétravail, localisation, notes libres). Le modèle fait trois choses :

▸Générer les bonnes requêtes — il lit ton profil et génère 5-10 requêtes LinkedIn pertinentes, en expliquant son raisonnement.
▸Récupérer les vrais jobs — ces requêtes vont chercher sur LinkedIn via JobSpy. Pas de simulation, des vraies offres.
▸Noter chaque offre — pour chaque paire (ton CV + l'offre), le modèle produit une note sur cinq dimensions avec une phrase d'explication par dimension : correspondance des compétences, pertinence de l'expérience, formation/certifications, secteur d'activité, alignement du niveau de séniorité.

Le résultat : une liste courte, pas 50 offres, avec un raisonnement lisible. Tu peux voir pourquoi la deuxième offre est meilleure que la troisième.

La mécanique : distillation et LoRA

Le principe : un "teacher" (DeepSeek V4 Pro) crée les labels, un "student" (Qwen3-8B) les apprend.

Pourquoi deux modèles ?

▸DeepSeek V4 Pro : cher, solide sur la logique structurée, suit les schémas JSON. Utilisé hors ligne pour générer les labels, zéro dépendance au moment du déploiement.
▸Qwen3-8B : tient sur un seul GPU grâce à la quantification, assez grand pour absorber les jugements du teacher.

La base d'entraînement : 2500 CV (issus de Kaggle), le teacher génère des requêtes, JobSpy les soumet à LinkedIn (10 000 offres réelles), le teacher note tout ça sur les cinq dimensions. Résultat : 4 jeux de données propres en clés étrangères.

Entraînement : deux adaptateurs LoRA (rang 16) sur un seul A100 via Modal, un pour la génération de requêtes, un pour la notation. Chacun fait une passe avec des points de sauvegarde tous les 200 pas.

Pourquoi ça change quoi

Deux enseignements du développement :

▸
Deux petits adaptateurs battent un gros modèle. Essayer de combiner requêtes + notation dans un seul LoRA provoquait des fuites de format : JSON d'un côté, prose de l'autre. Deux têtes permutées à chaud = zéro bug de ce type.
▸
Le prompt du teacher prime sur la taille du student. Reformuler les labels pour être ultra-spécifiques ("4 ans de Rust, le rôle en demande 5" au lieu de "bon match technique") s'est propagé via distillation. Le student reprend l'habitude.

Déploiement malin

Le Space tourne sur llama.cpp + ZeroGPU avec un détail qui compte : une seule inférence GPU par soumission, pas par offre. Toutes les notations pour tous les jobs d'une candidature se font en un seul appel. Le modèle charge une fois, diffuse les événements un à un en continu (format OpenAI). Ça évite les démarrages à froid du GPU et les requêtes proxy.

Le code complet du Space (construit avec Claude Code) est publié comme trace d'agent HuggingFace — tu vois chaque fausse piste et récupération, pas juste la version épurée.

Et concrètement pour toi ?

Choisis ton profil — la lecture de l'article change selon qui tu es.

🔭 Curieux

Pour toi, vois comment l'IA change le job search : au lieu de cliquer aveuglément, tu as bientôt un coach qui connaît tes vrais critères et te trouve les 20 meilleures offres sur 1000. C'est l'IA « utile » et spécialisée qu'on verra déployer partout.

Essayer maintenant

Tester le démonstrateur de recherche d'emploi →

Source