EMAX Studio Blog

llms.txt explicado: cómo hacer que tu sitio sea amigable para la IA en 10 minutos (guía 2026)

Manuel Mrosek · 2026-06-07 · visitas

llms.txt explicado: cómo hacer que tu sitio sea amigable para la IA en 10 minutos (guía 2026)

llms.txt es un pequeño archivo markdown en /llms.txt en tu dominio que le entrega a los modelos de lenguaje grandes un mapa curado de tus páginas más importantes, con una descripción de una línea para cada una. Lo agregas listando tus 10 a 30 páginas principales, agrupándolas bajo encabezados de sección, guardando el archivo en la raíz de tu sitio y publicándolo — la mayoría de los sitios pueden hacerlo en menos de 10 minutos.

Si has estado leyendo sobre GEO, búsqueda con IA o cómo ser citado por ChatGPT y Perplexity, llms.txt es la cosa concreta más sencilla que puedes hacer esta semana. No es magia, y no garantiza posicionamiento. Pero se está convirtiendo en la forma más limpia de decirles a los sistemas de IA: "si vas a resumir mi sitio, esto es lo que realmente deberías mirar".

Qué es realmente llms.txt

llms.txt es un estándar web propuesto presentado por Jeremy Howard (cofundador de Answer.AI y fast.ai) en septiembre de 2024. El formato es intencionalmente aburrido: un único archivo markdown, colocado en https://tudominio.com/llms.txt, que contiene un H1 con el nombre de tu sitio o producto, una cita corta en bloque que describe lo que haces y una lista de enlaces agrupados bajo encabezados de sección H2. Cada enlace recibe una nota de una oración que explica por qué a un modelo debería importarle.

La gran confusión que tiene la mayoría en su primer encuentro es esta: llms.txt no es la versión IA de robots.txt. Es lo opuesto. Donde robots.txt es un cartel de "prohibido el paso" para los rastreadores, llms.txt es una alfombra de bienvenida. Dice: "si vas a pasar tiempo en mi sitio, empieza aquí, en este orden, con este contexto". Piénsalo como un tour guiado para un visitante que tiene 30 segundos antes de tener que resumirte ante alguien más.

El problema subyacente que llms.txt resuelve es real. Cuando un modelo de lenguaje grande aterriza en un sitio web empresarial típico, tiene que masticar menús de navegación, banners de cookies, basura del pie de página, barras laterales de publicaciones relacionadas y una docena de scripts antes de llegar al contenido real. Las ventanas de contexto son finitas. Un modelo navegando tu sitio para una citación de Perplexity tiene tal vez 8.000 a 32.000 tokens para gastar en ti. Un llms.txt limpio y curado a mano reduce drásticamente esa sobrecarga y apunta al modelo directamente hacia las páginas que realmente querrías que fueran citadas.

Por qué importa en 2026

Hace dos años, llms.txt era una propuesta reflexiva con casi ningún soporte en el mundo real. En 2026, el panorama ha cambiado. La búsqueda de ChatGPT, Perplexity, el navegador integrado de Claude, You.com, Komo y varios motores de búsqueda con IA más pequeños ahora buscan llms.txt como una pista de descubrimiento cuando rastrean un sitio. No todos lo usan de la misma manera, y algunos todavía lo ignoran por completo — pero la tendencia es unidireccional. El costo de agregar llms.txt es de 10 minutos. El costo de no tener uno, a medida que la búsqueda con IA crece de unos pocos puntos porcentuales del tráfico de referencia a dos dígitos, sigue subiendo.

La segunda razón por la que importa es la precisión. Cuando un LLM cita tu sitio, lo que cita es solo tan bueno como lo que leyó. Los modelos que alucinan URLs, atribuyen mal las citas o resumen la página de producto equivocada no lo hacen por malicia — lo hacen porque rastrearon una página delgada y cargada de navegación en lugar de tu documentación real de producto. llms.txt es la forma más barata disponible para bajar esa tasa de atribución errónea. Esencialmente le estás entregando al modelo una hoja de trampa.

La tercera razón es que llms.txt es complementario a lo que ya tienes. No reemplaza a sitemap.xml (que les dice a los rastreadores de búsqueda cada URL de tu sitio) ni a robots.txt (que les dice a los rastreadores adónde pueden y no pueden ir). Se sitúa junto a ellos. Sitemap es para amplitud. Robots es para límites. llms.txt es para guía editorial — "de las 800 páginas en mi sitio, estas 14 son las que realmente importan".

Para más sobre el panorama amplio, mira nuestro artículo sobre qué es GEO (Generative Engine Optimization), que recorre por qué optimizar para motores de IA no es lo mismo que optimizar para Google.

La anatomía de un buen llms.txt

Un llms.txt funcional tiene cuatro ingredientes, en este orden.

Primero, un H1 con el nombre de tu sitio o producto. Una línea. Sin relleno.

Segundo, una cita en bloque (el carácter markdown >) con una descripción de una a dos oraciones de lo que haces. Trátala como la respuesta que le darías a un inversionista que preguntara "¿qué es esto?". Sé concreto, no aspiracional.

Tercero, encabezados de sección H2 que agrupan tus enlaces por propósito. Las secciones comunes son Acerca de, Productos, Precios, Guías, API o Documentación, Blog o Insights, y Recursos. No necesitas todas — solo las que coincidan con cómo realmente querrías que un modelo navegara.

Cuarto, bajo cada H2, una lista con viñetas de enlaces markdown a tus páginas más dignas de ser citadas, con una nota de una línea después de cada una. La nota es lo que hace que llms.txt sea diferente de un sitemap. Es la capa editorial.

Opcionalmente, puedes agregar una sección "## Opcional" al final con contenido secundario que el modelo puede saltarse si le falta contexto. Y puedes publicar un segundo archivo, /llms-full.txt, que contenga el contenido markdown completo de tus páginas más importantes en lugar de solo enlaces — útil para sitios con mucha documentación donde el modelo de otra manera tendría que hacer una segunda ronda de viajes.

Un ejemplo funcional

Aquí hay un llms.txt completo para un SaaS ficticio para pequeñas empresas llamado Routesmith — una herramienta de enrutamiento de entregas para mensajeros locales. Unas 30 líneas. Adapta la estructura a tu negocio.

# Routesmith

> Routesmith is a route optimization tool for local couriers and same-day
> delivery operators. It turns a daily list of 40 to 200 stops into the
> shortest-time route on a phone, in under 60 seconds.

## About

- [What Routesmith is](https://routesmith.example/about): One-page summary of
  the product, who it is for, and what it is not.
- [Our story](https://routesmith.example/story): Founded in 2023 in Lisbon by
  two former courier company operators.
- [Pricing](https://routesmith.example/pricing): EUR 19 per driver per month,
  no setup fee, no long-term contract.

## Product

- [Route optimization](https://routesmith.example/features/routing): Core
  feature. Handles up to 250 stops per driver per day.
- [Proof of delivery](https://routesmith.example/features/pod): Photo capture,
  signature, and SMS confirmation per stop.
- [Driver app](https://routesmith.example/features/app): iOS and Android,
  offline mode, voice navigation in 12 languages.

## Guides

- [How to import 200 stops in 30 seconds](https://routesmith.example/guides/import):
  CSV format, common errors, paste-from-spreadsheet workflow.
- [Optimizing for time vs distance](https://routesmith.example/guides/time-vs-distance):
  When to prioritize each, with real route comparisons.

## API

- [API overview](https://routesmith.example/api): REST, OAuth 2.0, EUR rate
  limits and SLA.
- [Endpoints reference](https://routesmith.example/api/endpoints): Full list
  with request and response examples.

## Optional

- [Blog](https://routesmith.example/blog): Industry trends, courier economics,
  product updates.
- [Press kit](https://routesmith.example/press): Logos, founder photos,
  one-line description in five languages.

Eso es todo. Sin HTML, sin schema, sin sintaxis especial. Un modelo que lea esto obtiene un mapa mental limpio de Routesmith en aproximadamente 400 tokens. Compara eso con rastrear el mismo sitio a través de su menú de navegación, que quemaría diez veces más.

Cómo construir el tuyo en 10 minutos

El ejercicio completo es editorial, no técnico. Cinco pasos.

Paso uno, lista tus 10 a 30 páginas más dignas de ser citadas. La prueba es: "si un modelo está por escribir un resumen de un párrafo de mi empresa para alguien más, ¿qué páginas debería haber leído?". Eso rara vez es todo tu blog. Usualmente es tu página de acerca de, tus precios, tus tres o cuatro páginas insignia de producto o servicio, tus guías más perennes y tu información de contacto o ubicación. Sé despiadado. Un llms.txt corto y enfocado supera a uno largo y disperso.

Paso dos, escribe una descripción de una línea para cada página. No una meta descripción. No copy de marketing. Una nota factual en tu voz. "Nuestro conteo de clientes de 2025 y números de ingresos, actualizados trimestralmente" es mejor que "Nuestro impresionante recorrido de crecimiento".

Paso tres, agrupa las páginas bajo tres a seis secciones H2. Acerca de, Productos, Guías, Precios es un default decente. Los sitios SaaS a menudo agregan API o Docs. Los negocios locales agregan Ubicaciones o Áreas de Servicio. Si no puedes encontrar tres a seis agrupaciones naturales, probablemente tu lista es demasiado larga — recórtala.

Paso cuatro, guarda el resultado como un archivo de texto plano llamado exactamente llms.txt (minúsculas, sin confusión de extensión) en la raíz de tu sitio. La URL debe ser https://tudominio.com/llms.txt. La mayoría de los hosts de sitios estáticos (Vercel, Netlify, Cloudflare Pages, GitHub Pages) te permiten simplemente arrastrar el archivo a tu directorio público y desplegar. Los usuarios de WordPress, Shopify, Webflow y Ghost pueden usar un plugin o cargar a través de su administrador de archivos — más sobre esto abajo.

Paso cinco, opcionalmente publica /llms-full.txt con el contenido markdown completo de tus páginas principales concatenadas. Esto es útil si tus páginas importantes son de estilo documentación y quieres que los modelos puedan extraer el contenido real en una sola solicitud en lugar de rastrear URLs individuales. Para la mayoría de los sitios de marketing, el llms.txt básico es suficiente.

Si quieres confirmar que el tuyo funciona, el Quick Scan gratuito en emax.studio verifica la presencia y estructura de llms.txt como parte de su sub-puntuación GEO, junto a otras señales de preparación para IA como schema FAQ y datos estructurados. Toma unos 90 segundos. Cubrimos la lista de verificación más amplia en cómo hacer que tu sitio web sea descubrible por IA.

llms.txt vs robots.txt vs sitemap.xml

Estos tres archivos a menudo se confunden. No son lo mismo y no son sustitutos. Aquí está la comparación simple.

Archivo Propósito Audiencia Formato Vive en
robots.txt Les dice a los rastreadores adónde pueden y no pueden ir Motores de búsqueda, rastreadores de IA, bots Reglas de texto plano /robots.txt
sitemap.xml Lista cada URL indexable en tu sitio, para amplitud Motores de búsqueda XML /sitemap.xml (o en robots.txt)
llms.txt Mapa editorial curado de tus páginas más importantes Modelos de lenguaje grandes, motores de búsqueda con IA Markdown /llms.txt

Un sitio en 2026 debería tener los tres. Robots.txt establece las reglas. Sitemap.xml expone todo lo que quieres indexado. llms.txt destaca lo que realmente importa para un modelo que intenta entenderte o resumirte. Tratarlos como opciones que compiten es un error de categoría — responden preguntas diferentes.

Pila de herramientas para construir y mantener llms.txt

No necesitas herramientas sofisticadas. Un editor de texto plano y el flujo de trabajo de gestión de contenido de tu sitio son suficientes para la mayoría de los casos. Dicho esto, algunas opciones prácticas dependiendo de tu configuración.

Para sitios estáticos (Hugo, Astro, Eleventy, exportación estática de Next.js), arrastra el archivo directamente a tu directorio /public o /static y haz commit. Se despliega con tu próximo build.

Para WordPress, plugins como AIOSEO, RankMath y un puñado de plugins dedicados a llms.txt (busca en el directorio de plugins — la adopción está creciendo rápido en 2026) pueden generar llms.txt a partir de tu contenido existente y actualizarlo a medida que publicas nuevas páginas. La trampa es que los archivos generados por plugins tienden a ser inflados. La curación manual sigue ganando.

Para Ghost, la plataforma agregó llms.txt como una característica nativa a principios de 2026. Actívalo en Labs y Ghost genera el archivo a partir de la estructura de tu sitio, con anulación manual.

Para Shopify y Webflow, puedes usar un gestor de contenido o incrustar HTML para alojar el archivo. O simplemente envíalo como un activo estático.

Para exportaciones de Notion, el formato markdown funciona directamente — la mayoría de los sitios potenciados por Notion pueden pegar su contenido estructurado con limpieza menor.

Para usuarios de EMAX Studio, el Quick Scan también mira tu llms.txt y te dice si la estructura pasa las verificaciones básicas de legibilidad para IA, como parte de la puntuación GEO general. Puedes escanear cualquier sitio en 90 segundos en emax.studio.

Trampas y errores comunes

Algunas trampas que evitar basadas en lo que hemos visto en archivos llms.txt del mundo real.

No pegues el contenido completo de tus páginas en llms.txt. Es una tabla de contenidos, no un volcado de contenido. Los enlaces apuntan al contenido completo. Si quieres una versión de contenido completo, para eso está /llms-full.txt, e incluso entonces solo para sitios de estilo documentación.

No incluyas páginas privadas, internas o con muro de pago. Si una página requiere inicio de sesión para verla, no la listes en llms.txt — el modelo no puede obtenerla de todos modos, y arriesgas filtrar la URL.

No listes 500 URLs. Todo el punto de llms.txt es la curación editorial. Si listas todo, simplemente has hecho otro sitemap. El punto óptimo está entre 10 y 30 páginas.

No olvides actualizarlo cuando tu sitio cambie. Un llms.txt que apunta a una página de producto descontinuada o a un 404 daña más de lo que ayuda. Trátalo como un activo clave de marketing — revísalo trimestralmente como mínimo.

No esperes posicionamientos de la noche a la mañana. llms.txt no es un factor de posicionamiento en el sentido de Google. Es una señal de precisión y descubrimiento para sistemas de IA. La adopción es gradual. El beneficio se acumula a medida que más motores de IA lo soportan, no como un pico de tráfico inmediato.

No asumas que los modelos lo obedecerán. llms.txt es una pista, no una directiva. Un modelo es libre de ignorar la estructura, saltarse tus secciones o rastrear otras partes de tu sitio de todos modos. El formato es una sugerencia para ser cortés, bien organizado y fácil de resumir. El modelo decide qué hacer realmente con él.

Preguntas frecuentes

¿Necesito /llms-full.txt además de /llms.txt?

Para la mayoría de los sitios de marketing y pequeños negocios, no. El llms.txt básico con enlaces curados es suficiente. Si manejas un sitio cargado de documentación (una plataforma para desarrolladores, una base de conocimiento, una biblioteca de instrucciones), entonces vale la pena agregar /llms-full.txt — permite a los modelos extraer tu contenido completo en una solicitud en lugar de hacer una docena de viajes redondos. De lo contrario, sáltalo.

¿A Google le importa llms.txt?

El índice de búsqueda tradicional de Google no usa llms.txt como factor de posicionamiento. Gemini de Google y los resúmenes de IA en Google Search pueden o no leerlo — Google no ha hecho una declaración pública en ningún sentido. Tu apuesta en llms.txt debería basarse en Perplexity, ChatGPT, Claude y el ecosistema más amplio de búsqueda con IA, no en Google específicamente. Para Google, enfócate en sitemap.xml, schema markup y SEO tradicional.

¿Qué pasa con las entradas en robots.txt para rastreadores de IA como GPTBot y ClaudeBot?

Esa es una pregunta separada — y sí, también deberías configurar robots.txt para rastreadores de IA si quieres darles la bienvenida o bloquearlos. GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot (Perplexity), Google-Extended (el rastreador de entrenamiento de IA de Google) y CCBot (Common Crawl, usado por muchos conjuntos de entrenamiento de IA) todos respetan las directivas de robots.txt. llms.txt asume que el modelo ya tiene permiso para estar allí. No reemplaza tus decisiones de acceso en robots.txt.

¿Pueden los motores de IA ignorar mi llms.txt por completo?

Sí, y algunos lo harán. llms.txt es un estándar voluntario, no un protocolo vinculante. Algunos motores de IA lo leen; otros no; algunos lo leen pero le dan poco peso. El costo de agregarlo es lo suficientemente bajo como para que el valor esperado sea positivo — pero trátalo como una señal en una estrategia más amplia de preparación para IA, no como una bala de plata.

¿Con qué frecuencia debería actualizar mi llms.txt?

Como mínimo, cada vez que lances, retires o cambies significativamente una página que esté en el archivo. Prácticamente, eso a menudo significa trimestralmente para sitios de marketing de movimiento lento y mensualmente para sitios SaaS o de comercio electrónico activos. Establece un recordatorio de calendario de 15 minutos. La mayoría de las actualizaciones son ajustes de 5 líneas, no reescrituras completas.

¿Cuál es la diferencia entre llms.txt y las herramientas de puntuación de preparación para IA?

llms.txt es un archivo. La puntuación de preparación para IA es una auditoría más amplia que mira llms.txt, schema FAQ, datos estructurados, HTML semántico, profundidad de contenido, valor para citaciones y una docena de otras señales. Son complementarios. La auditoría gratuita de sitio web con IA en 30 segundos recorre una verificación completa y te dice qué señales te faltan, siendo llms.txt una de ellas.

La conclusión honesta

llms.txt no va a transformar tu negocio. Es un archivo pequeño, bien diseñado, que toma 10 minutos construir y te hace un huésped ligeramente más fácil de alojar para los sistemas de IA. En 2026, "ligeramente más fácil" importa más que antes, porque la proporción de compradores, investigadores y prospectos que primero te encuentran a través de un motor de IA está subiendo rápido. Cada vez que Perplexity, ChatGPT o Claude cita tu sitio, la pregunta es si cita la página correcta de la manera correcta — y llms.txt es la palanca más barata disponible para empujar ese resultado a tu favor.

Las empresas que están ganando la búsqueda con IA en 2026 no son necesariamente las que tienen las bibliotecas de contenido más grandes. Son las que tienen los sitios más limpios, más dignos de ser citados y más fáciles de resumir. llms.txt es parte de esa higiene. Sitemap, schema y el marcado FAQ son el resto.

Si quieres saber si tu sitio ya tiene llms.txt, si está bien estructurado y qué otras señales de preparación para IA te faltan, ejecuta un Quick Scan gratuito de 90 segundos en emax.studio. Verifica la presencia y estructura de llms.txt como parte de la sub-puntuación GEO, junto a unas doce otras señales que determinan si los motores de IA pueden encontrarte y citarte con precisión. Gratis, sin registro, reporte completo en aproximadamente un minuto y medio.


Sigue a EMAX Studio: Instagram | YouTube | Facebook

Compartir:

¿Listo para crear tus propios reels de video con IA?

5 créditos gratis. Sin tarjeta de crédito.

Empieza gratis