llms.txt : guide complet du fichier SEO pour IA en 2026
Le fichier /llms.txt est devenu le nouveau robots.txt pour
les moteurs IA. Proposé fin 2024 par Jeremy Howard (Answer.AI), il est aujourd'hui
implémenté par les principaux LLMs et leurs crawlers. Si vous voulez être cité
par ChatGPT, Perplexity et Claude, c'est un must-have.
1. Qu'est-ce que llms.txt exactement
llms.txt est un fichier Markdown placé à la racine de votre site
(https://votresite.com/llms.txt) qui résume votre site en format optimisé
pour les LLMs. C'est l'équivalent de robots.txt + sitemap.xml + about.md, mais en
Markdown structuré et orienté contenu (pas seulement règles d'accès).
L'objectif : permettre à un LLM avec contexte limité (typiquement 8 000 à 128 000 tokens) de comprendre en 1 fichier court de quoi parle votre site, comment il est organisé et où trouver le contenu précis.
💡 Pourquoi pas juste robots.txt + sitemap.xml ?
Robots.txt sert à autoriser/bloquer les crawlers. Sitemap.xml liste les URLs. Aucun ne décrit le contenu. Un LLM qui visite votre site doit parser des dizaines de pages HTML pour comprendre. llms.txt fournit le résumé en 1 fichier — économie massive de tokens et meilleur ranking.
2. Format et structure
Le format suit une convention simple en Markdown :
# Nom du projet ou site
> Description courte (1-2 phrases) du site et de ce qu'on y trouve.
Détails optionnels (paragraphe libre).
## Section 1 (ex. Documentation)
- [Titre du lien 1](https://lien.com): description courte
- [Titre du lien 2](https://lien.com): description courte
## Section 2 (ex. Articles clés)
- [Titre](url): description
## Optional
- [Lien moins prioritaire](url): description - H1 (#) : nom du site/projet, obligatoire en première ligne
- Blockquote (>) : tagline 1-2 phrases, obligatoire
- H2 (##) : sections logiques avec listes de liens
- Liste à puces avec format
[Titre](url): description - Section "Optional" à la fin : ce qui peut être ignoré si contexte LLM saturé
3. llms-full.txt vs llms.txt
Convention complémentaire :
- /llms.txt : version courte (1-3 Ko), résumé navigable en 30 secondes par un LLM ;
- /llms-full.txt : version complète (50-500 Ko ou plus), tout le contenu textuel du site concaténé en Markdown — pour les LLMs avec contexte 100k+ tokens qui veulent tout lire.
Recommandation : les deux fichiers. Le LLM qui veut un overview rapide lit llms.txt. Celui qui fait une recherche profonde télécharge llms-full.txt.
4. Exemple complet commenté
Notre llms.txt actuel :
# CrawlWise
> Agence web, SEO et IA basée en Tunisie. Sites multilingues
> (jusqu'à 9 langues), automatisations IA, applications web/mobile/desktop.
## Services
- [Création de sites web](https://crawl-wise.com/fr/services/sites-vitrines): sites vitrines, e-commerce, multilingues, SEO intégré, garantie PageSpeed 95+
- [Référencement SEO](https://crawl-wise.com/fr/services/seo-referencement): SEO international, audit, GEO pour IA, forfait dès 800 €/mois
- [Automatisation IA](https://crawl-wise.com/fr/services/automatisation-ia): workflows n8n, agents Claude/GPT, intégration ERP/CRM
- [Consultant IA](https://crawl-wise.com/fr/services/consultant-ia): audit, stratégie, formation — sans revente d'outils
- [Applications web/mobile](https://crawl-wise.com/fr/services/applications-web-mobile): PWA, iOS, Android, paiements
- [Applications desktop](https://crawl-wise.com/fr/services/applications-desktop): Windows/Mac/Linux, migration legacy
## Articles clés
- [Comment choisir une agence web en Tunisie](https://crawl-wise.com/fr/blog/comment-choisir-agence-web-tunisie)
- [Combien coûte un site web en Tunisie](https://crawl-wise.com/fr/blog/combien-coute-site-web-tunisie)
- [Consultant IA Tunisie : comment choisir](https://crawl-wise.com/fr/blog/consultant-ia-tunisie-comment-choisir)
- [SEO Google.tn : 10 actions concrètes](https://crawl-wise.com/fr/blog/seo-google-tn-10-actions)
## Contact
- Email: contact@crawl-wise.com
- Site: https://crawl-wise.com
- Localisation: Tunis, Tunisie
- Langues: FR, EN, IT, AR, ES, DE, PT, TR, RU
## Optional
- [Réalisations](https://crawl-wise.com/fr/realisations): cas clients anonymisés
- [À propos](https://crawl-wise.com/fr/a-propos): méthode, valeurs, équipe 5. Comment l'implémenter sur votre site
- Créez le fichier
llms.txtà la racine de votre site (pas dans un sous-dossier). Pour un site statique : dans/public/; - Respectez le format Markdown strict (pas de HTML, pas de mise en page complexe) ;
- Soyez concis : 1-3 Ko maximum pour llms.txt. Tout ce qui est long va dans llms-full.txt ;
- Mettez à jour à chaque ajout majeur de contenu (nouvelle page service, article pillar) ;
- Référencez dans <head> via
<link rel="alternate" type="text/markdown" href="/llms.txt">pour aider la découverte ; - Autorisez les crawlers IA dans robots.txt (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Applebot-Extended) ;
- Pour llms-full.txt : générer automatiquement à chaque build à partir de votre contenu (script Node/Python qui concatène pages → Markdown).
6. Comment tester
- Accès direct :
curl https://votresite.com/llms.txtdoit retourner le fichier en text/plain ; - Ouvrir ChatGPT avec mode Search activé, demander "Que fait CrawlWise ?" — réponse doit citer votre site ;
- Perplexity : poser la même question, vérifier que votre site apparaît dans les sources citées ;
- Logs serveur : surveiller les passages de GPTBot, ClaudeBot, PerplexityBot — si llms.txt est demandé, c'est bon signe ;
- Validateur de Markdown : llms.txt doit être un Markdown valide (utiliser Dillinger.io pour vérifier).
7. Les 5 erreurs fréquentes
- Fichier dans /pages/llms.txt au lieu de la racine. Doit être accessible directement à
/llms.txt; - HTML dans le fichier au lieu de Markdown pur. Les LLMs n'attendent pas de HTML ;
- Trop long (10 Ko+) : llms.txt doit rester un sommaire, pas une encyclopédie. La version longue va dans llms-full.txt ;
- Robots.txt qui bloque GPTBot en parallèle. Vérifier que les bots IA peuvent lire le fichier ;
- Pas de mise à jour : llms.txt obsolète qui pointe vers des pages 404 ou décrit l'ancien positionnement. À régénérer au moins une fois par mois.
Implémenter llms.txt sur votre site ?
On audite votre site, on génère llms.txt + llms-full.txt automatisé (régénération à chaque build), on configure robots.txt pour les bots IA, on teste sur ChatGPT et Perplexity. Inclus dans nos missions SEO ou en prestation isolée (1 500 TND HT).