llms.txt, explique pour les proprios de sites WordPress.

llms.txt est un standard propose pour aider les systemes IA a trouver et comprendre le contenu important de ton site. C'est aux LLM crawlers ce que sitemap.xml etait aux moteurs de recherche il y a dix ans — mais plus simple, et sans doute plus important.

Ce que c'est

llms.txt est un fichier texte brut que tu sers a la racine de ton domaine — a /llms.txt — qui decrit ton site pour les large language models. Il a ete propose par Jeremy Howard (fondateur de fast.ai) fin 2024. C'est une convention communautaire, pas un standard IETF. L'adoption cote publication est large — des boites comme Anthropic, Cloudflare, Stripe et Vercel en servent un a leur racine — mais les crawlers qui le consomment reellement sont restes plutot silencieux a ce sujet en public.

En pratique, il y a deux fichiers lies :

  • /llms.txt — un court manifeste listant tes pages cles avec des descriptions
  • /llms-full.txt — le contenu reel de ton site, converti en Markdown propre

En quoi il differe de robots.txt et sitemap.xml

robots.txt dit aux crawlers ce qu'ils peuvent et ne peuvent pas visiter. sitemap.xml leur dit ou trouver chaque page. llms.txt va un cran plus loin : il dit aux LLMs pourquoi chaque page compte et leur donne le contenu dans un format leger a consommer — pas de parsing HTML, pas de clutter de navigation, pas de JavaScript requis.

Ce dernier point est l'avantage discret. Quand un AI crawler visite une page WordPress classique, il depense des tokens a parser le markup du theme pour trouver le contenu reel. Avec llms-full.txt, tu lui donnes le contenu directement — dans le format le plus light a parser.

A quoi ressemble un llms.txt minimal

# Cabinet Comptable Dupont

> Cabinet comptable pour PME base a Paris.
> Specialise en comptabilite, declarations fiscales et TVA.

## Services

- [Comptabilite](/services/comptabilite/): Comptabilite mensuelle a partir de 200 EUR/mois
- [Declarations fiscales](/services/fiscal/): Declarations pour particuliers et entreprises
- [TVA](/services/tva/): Mise en place et conformite TVA

## A propos

- [A propos](/a-propos/): Cabinet depuis 12 ans, 40+ clients
- [Contact](/contact/): Coordonnees du bureau parisien

Le blockquote en haut est la description du site. Chaque H2 regroupe des pages. Chaque element de liste est une page avec une description en une ligne. C'est toute la spec.

A quoi ressemble llms-full.txt

Meme structure, mais avec le texte complet de chaque page ajoute. Au lieu d'un lien vers /services/comptabilite/, tu as la page comptabilite entiere en Markdown — titres, paragraphes, FAQ, tout. Les AI crawlers peuvent indexer le fichier entier en une seule requete.

Les AI crawlers vont-ils vraiment le respecter ?

Honnetement : personne ne l'a confirme de facon certaine. Aucun grand fournisseur d'IA n'a publie d'engagement formel a consommer llms.txt comme comportement de crawler, et ceux qui se sont exprimes publiquement sont restes volontairement vagues. Certains rapports independants suggerent que les systemes de retrieval parsent les fichiers quand ils les trouvent ; d'autres disent que l'effet est indistinguable d'avoir le meme contenu dans du HTML bien structure.

L'argument honnete pour en publier un quand meme : le fichier ne coute rien a servir et n'enleve rien a ton site. Si ca aide avec la citation IA, tant mieux. Si ca ne fait rien, tu as ajoute quelques kilo-octets de texte brut a ta racine. C'est une assurance pas chere, pas un signal garanti.

Comment ajouter llms.txt a WordPress

Trois options :

  1. L'ecrire a la main. Cree un fichier texte, upload-le a la racine de ton site via FTP. Mets-le a jour a chaque fois que tu ajoutes ou supprimes des pages. Probablement ok pour un site de 10 pages, penible pour tout le reste.
  2. Utiliser un snippet de code. Enregistre une rewrite rule et un handler template_redirect qui output le fichier a partir de ton sitemap. Ca marche si tu es a l'aise avec functions.php.
  3. Utiliser Dennis GEO. Le plugin genere /llms.txt et /llms-full.txt automatiquement a partir de ton sitemap et de tes descriptions par page. Regeneration a chaque publication. Sans code.

Evidemment je recommanderais l'option trois, mais les options un et deux sont aussi parfaitement valables.

Teste sur ton site

Va sur https://tonsite.com/llms.txt et regarde si le fichier existe. Si tu as une 404, rien ne dit aux AI crawlers comment lire ton site.