llms.txt, explicado para duenos de sitios WordPress.

llms.txt es un estandar propuesto para ayudar a los sistemas de IA a encontrar y entender el contenido valioso de tu sitio web. Es para los LLM crawlers lo que sitemap.xml fue para los motores de busqueda hace una decada — pero mas simple, y posiblemente mas importante.

Que es

llms.txt es un archivo de texto plano que sirves en la raiz de tu dominio — en /llms.txt — que describe tu sitio para large language models. Fue propuesto por Jeremy Howard (fundador de fast.ai) a finales de 2024. Es una convencion de la comunidad, no un estandar IETF. La adopcion del lado de publishers es amplia — empresas como Anthropic, Cloudflare, Stripe y Vercel sirven uno en su raiz — pero los crawlers que realmente lo consumen han sido mayormente silenciosos al respecto en publico.

En la practica hay dos archivos relacionados:

  • /llms.txt — un manifiesto corto que lista tus paginas clave con descripciones
  • /llms-full.txt — el contenido real de tu sitio, convertido a Markdown limpio

Como se diferencia de robots.txt y sitemap.xml

robots.txt le dice a los crawlers que pueden y que no pueden visitar. sitemap.xml les dice donde encontrar cada pagina. llms.txt va un paso mas alla: le dice a los LLMs por que cada pagina importa y les da el contenido en un formato barato de leer — sin parsing de HTML, sin clutter de navegacion, sin JavaScript requerido.

Esa ultima parte es la ventaja silenciosa. Cuando un AI crawler visita una pagina tipica de WordPress, gasta tokens parseando el markup del theme para encontrar el contenido real. Con llms-full.txt, le entregas el contenido directamente — y lo haces en el formato mas barato de consumir.

Como se ve un llms.txt minimo

# Acme Contabilidad

> Firma de contabilidad para pymes con sede en Madrid.
> Nos especializamos en contabilidad, declaraciones de impuestos e IVA.

## Servicios

- [Contabilidad](/servicios/contabilidad/): Contabilidad mensual desde 200 EUR/mes
- [Declaraciones](/servicios/impuestos/): Declaraciones de impuestos personales y corporativas
- [Registro IVA](/servicios/iva/): Configuracion y cumplimiento de IVA en la UE

## Sobre nosotros

- [Sobre nosotros](/sobre/): Firma con 12 anos de experiencia, 40+ clientes
- [Contacto](/contacto/): Detalles de la oficina en Madrid

El blockquote del inicio es la descripcion del sitio. Cada H2 agrupa paginas. Cada item de lista es una pagina con una descripcion de una linea. Esa es toda la spec.

Como se ve llms-full.txt

Misma estructura, pero con el texto completo de cada pagina adjunto. Entonces en vez de un link a /servicios/contabilidad/, tienes la pagina completa de contabilidad renderizada como Markdown — headings, parrafos, FAQs, todo. Los AI crawlers pueden indexar el archivo entero en un solo request.

Los AI crawlers realmente lo respetan?

Honestamente: nadie lo ha dicho con certeza todavia. Ningun vendor de IA importante ha publicado un compromiso formal de consumir llms.txt como comportamiento de crawler, y los que han hablado publicamente han sido deliberadamente vagos. Algunos reportes independientes sugieren que los sistemas de retrieval si parsean los archivos cuando los encuentran; otros dicen que el efecto es indistinguible de tener el mismo contenido en HTML bien estructurado.

El argumento honesto para publicar uno de todas formas: el archivo no cuesta nada servirlo y no le quita nada a tu sitio. Si ayuda con la citacion por IA, bien. Si no hace nada, agregaste unos pocos kilobytes de texto plano a tu raiz. Es un seguro barato, no una signal garantizada.

Como agregar llms.txt a WordPress

Tres opciones:

  1. Escribirlo a mano. Crea un archivo de texto, subelo a la raiz de tu sitio por FTP. Actualizalo cada vez que agregues o quites paginas. Probablemente esta bien para un sitio de 10 paginas, doloroso para algo mas grande.
  2. Usar un snippet de codigo. Registra una rewrite rule y un handler de template_redirect que genere el archivo desde tu sitemap. Funciona si te sientes comodo con functions.php.
  3. Usar Dennis GEO. El plugin genera tanto /llms.txt como /llms-full.txt automaticamente desde tu sitemap y las descripciones por pagina. Se regenera al publicar. Sin codigo.

Obviamente recomendaria la opcion tres, pero las opciones uno y dos tambien son legitimas.

Pruebalo en tu sitio

Visita https://tusitio.com/llms.txt y fijate si el archivo existe. Si recibes un 404, nada le esta diciendo a los AI crawlers como leer tu sitio.