Le combo SEO + IA 2026 — 3 fichiers pour exister sur Google et ChatGPT
3 fichiers texte (llms.txt, markdown mirrors, sitemap.xml) à ajouter à ton site pour être visible sur Google et les IA en 2026 — avec 3 prompts Claude Code.
🌐 GUIDE COMPLET : Le combo SEO + IA en 2026 — par Pierre Cordelier.
Le trafic depuis ChatGPT, Claude et Perplexity grandit 165 fois plus vite que le trafic Google organique. Si ton site n'est pas adapté aux IA, tu disparais des recommandations. Voici les 3 fichiers texte à ajouter, avec les prompts Claude Code prêts à coller et le setup pas-à-pas.
1. llms.txt — Le pitch écrit pour les IA
Ce que c'est : un fichier texte placé à la racine de ton site (tonsite.com/llms.txt) qui résume ce que fait ton business, où, à quel prix.
Qui le lit officiellement en 2026 :
- ✅ Anthropic (Claude) — depuis janvier 2026
- ✅ Cursor, Mintlify — supportent natif
- ⚠️ ChatGPT et Perplexity — peuvent le lire si prompted, pas systématique
- ❌ Google — pas adopté
Prompt Claude Code à coller :
Crée un fichier llms.txt pour mon business. C'est un fichier texte à la
racine de mon site qui dit aux IA (ChatGPT, Claude, Perplexity) ce que je
fais, pour qu'elles me recommandent quand quelqu'un pose une question dans
mon secteur.
Avant d'écrire quoi que ce soit, interview-moi pour récupérer toutes les
infos qu'il te manque (nom, ce que je fais, zones servies, contact, services
+ tarifs réels, ce qui me différencie, crédibilité). Pose-moi les questions
une par une, pas de gros bloc.
Si tu as accès à mon dossier de site, regarde déjà ce que tu peux
auto-détecter avant de me demander.
Une fois que tu as tout, écris le llms.txt avec ces sections :
About, Services and Pricing, Locations, Contact, Service Area, Key Facts,
What Makes Us Different, FAQ (5-8 vraies questions clients avec réponses
courtes et chiffrées).
Phrases courtes, chiffres précis partout, zéro blabla marketing.
Format markdown : H1 nom du site, blockquote résumé, sections H2 avec listes
de liens.
Sauvegarde-le sous llms.txt à la racine.
Important : mets de vrais tarifs. Les IA citent les business qui donnent des fourchettes précises et ignorent ceux qui disent "nous contacter pour un devis".
2. Markdown mirrors — La version propre pour les IA
Ce que c'est : une version texte de chaque page (sans HTML, sans pubs, sans popups). Accessible en ajoutant /index.md ou .md à la fin de l'URL.
Option ultra-facile (recommandée) : Cloudflare Markdown for Agents
Cloudflare a sorti Markdown for Agents le 12 février 2026. Il convertit automatiquement tes pages HTML en markdown quand un bot IA le demande. 80% de tokens en moins côté IA.
Setup en 4 clics :
- Connecte-toi à dash.cloudflare.com (compte Pro ou Business requis)
- Sélectionne ta zone (ton domaine)
- Va dans AI Crawl Control > Markdown for Agents
- Toggle sur On → Deploy
Option script (si tu n'as pas Cloudflare)
Je veux générer des markdown mirrors pour chaque page de mon site, pour
donner aux IA une version propre de chaque page (sans HTML, scripts,
ni junk visuel).
Avant de commencer :
1. Scanne mon dossier de site et dis-moi ce que tu vois (structure,
nombre de pages, hébergeur détecté).
2. Demande-moi seulement ce que tu peux pas deviner.
Ensuite :
- Écris un script Python qui parcourt chaque index.html, strip
nav/footer/scripts/popups, convertit en markdown propre via markdownify,
ajoute en haut title/description/url/last_updated, et sauvegarde
le résultat à côté de chaque page sous index.md.
- Lance-le et montre-moi combien de fichiers ont été générés.
- Configure mon hébergeur pour servir les .md en
Content-Type: text/plain (sinon ils se téléchargent au lieu de
s'afficher). Si t'as un doute sur l'hébergeur, demande-moi.
- Ajoute une section "Markdown Mirrors" à mon llms.txt qui liste
toutes les URLs générées.
3. sitemap.xml — La carte de ton site
Ce que c'est : un fichier XML qui dit à Google quelles pages existent et lesquelles comptent le plus. Indispensable pour le SEO classique. Aussi utilisé par les crawlers IA pour explorer ton site.
Prompt Claude Code à coller :
Génère un sitemap.xml pour mon site.
Scanne d'abord mon dossier et propose-moi une répartition de priorités
basée sur ce que tu vois (homepage 1.0, pages services 0.9,
about/contact 0.8, blog 0.7, etc.). Demande-moi confirmation
ou ajustement avant de générer.
Ensuite :
- Sauvegarde sitemap.xml à la racine avec date du jour en lastmod,
changefreq "weekly" pour la home et "monthly" pour le reste,
format XML standard sitemaps.org.
- Vérifie/crée mon robots.txt pour autoriser tous les crawlers,
autoriser explicitement GPTBot, ClaudeBot, PerplexityBot,
Google-Extended, OAI-SearchBot, ChatGPT-User, Claude-User,
Perplexity-User, et pointer vers le sitemap.
- Guide-moi pas-à-pas pour ajouter mon site à Google Search Console
et soumettre le sitemap.
Snippet robots.txt à inclure (autorise les 8 bots IA principaux) :
User-agent: GPTBot
Allow: /
User-agent: OAI-SearchBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: Claude-User
Allow: /
User-agent: Claude-SearchBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Perplexity-User
Allow: /
Sitemap: https://tonsite.com/sitemap.xml
4. Vérifier que ça marche
Tester ton llms.txt :
- Ouvre
https://tonsite.com/llms.txtdans ton navigateur — ça doit s'afficher en texte curl https://tonsite.com/llms.txtrenvoie le contenu
Tester tes markdown mirrors :
- Ouvre
https://tonsite.com/index.md— ça doit afficher du markdown brut, pas télécharger un fichier
Tester ton sitemap :
- Soumets-le dans Google Search Console > Sitemaps
- Délai d'indexation Google : 24-72h
- Délai pour voir un effet sur les IA : 4 à 8 semaines
5. Ce qu'il faut PAS attendre
Une étude OtterlyAI sur 90 jours et 62 100 requêtes de bots IA montre que seulement 84 ont touché un llms.txt (0,1%). Une autre étude Generix sur 2 500 sites top : adoption 6,5%, lift de citations 1,27x — pas significatif statistiquement.
Donc le combo "3 fichiers" est utile (sitemap pour Google = obligatoire, markdown mirrors via Cloudflare = facile et efficace, llms.txt = filet de sécurité pour Anthropic) mais pas suffisant. Les vrais leviers pour te faire citer par les IA :
- Autorité topique : du contenu profond sur 1 niche, pas 50 articles génériques
- Structure lisible : titres nets, chiffres précis, FAQ courtes
- Présence multi-moteurs : Reddit, LinkedIn, articles tiers — 92% des citations IA viennent de sites jamais déclarés en llms.txt