
Actualizado por
Actualizado el Apr 27, 2026
TL;DR: LLMs.txt es un archivo de texto simple que indica a los rastreadores de IA (GPTBot, ClaudeBot, PerplexityBot, Gemini) qué partes de su sitio de comercio electrónico se pueden acceder, citar o omitir. A diferencia de robots.txt — que controla los bots de motores de búsqueda tradicionales — LLMs.txt influye directamente en si sus páginas de productos, contenido de preguntas frecuentes y guías de compra aparecen en las respuestas de compras generadas por IA. Esta guía cubre la configuración, la estrategia, la implementación en la plataforma y el mantenimiento continuo.
Cuando un cliente pregunta a ChatGPT "¿cuáles son los mejores zapatos para correr sostenibles por menos de $150?" — ¿de dónde proviene la respuesta? El modelo utiliza una combinación de datos de entrenamiento y recuperación web en tiempo real, extrayendo información de productos, reseñas y contenido editorial de fuentes a las que se le ha permitido acceder y que considera creíbles. Si las páginas de productos de su sitio de comercio electrónico, guías de compra y contenido de preguntas frecuentes no son accesibles para los rastreadores de IA que alimentan estas respuestas, su marca no puede aparecer en esa respuesta — independientemente de cuán fuerte sea su rendimiento de SEO tradicional.
LLMs.txt es un nuevo estándar técnico —similar en concepto a robots.txt— que brinda a los propietarios de sitios web control directo sobre cómo los rastreadores de IA interactúan con su contenido. Para las marcas de comercio electrónico, LLMs.txt es un mecanismo poderoso para garantizar que el contenido de producto correcto se presente a los sistemas de IA, mientras se mantienen fuera del proceso de indexación de IA las páginas de bajo valor o sensibles (páginas de carrito, áreas de cuenta, URL de categorías filtradas).
Esta guía cubre todo lo que los equipos de comercio electrónico necesitan saber sobre LLMs.txt: qué es, por qué es importante, cómo configurarlo correctamente, qué incluir para una máxima visibilidad en compras de IA y cómo mantenerlo a lo largo del tiempo.
LLMs.txt es un archivo de texto plano alojado en la raíz de su dominio (por ejemplo, tu tienda.com/llms.txt) que se comunica directamente con los rastreadores de IA — los bots que alimentan la búsqueda generativa y los agentes de IA conversacionales. Utiliza directivas para especificar qué contenido pueden acceder, citar u omitir los sistemas de IA.
El paralelo conceptual con robots.txt es claro, pero la función es distinta:
| Característica | robots.txt | LLMs.txt |
|---|---|---|
| Controla los bots de búsqueda tradicionales | ✅ Sí | ❌ No |
| Controla los rastreadores de IA/LLM | ❌ No | ✅ Sí |
| Influye en las respuestas generadas por IA | ❌ Limitado | ✅ Directamente |
| Control de citación y atribución | ❌ Ninguno | ✅ Opcional a través de directivas de fuente de datos |
| Orientación de feed de compras | ❌ Ninguno | ✅ A través de referencias de mapa del sitio/fuente de datos |
La distinción clave: robots.txt le dice a Googlebot y Bingbot qué indexar para clasificaciones de búsqueda tradicionales. LLMs.txt le dice a GPTBot, ClaudeBot, PerplexityBot y Gemini qué usar al generar respuestas de compras potenciadas por IA, comparaciones de productos y recomendaciones de marcas.
A partir de 2026, el cumplimiento voluntario por parte de los rastreadores de IA con las directrices de LLMs.txt varía según la plataforma. Sin embargo, las principales empresas de IA — OpenAI, Anthropic, Google, Perplexity — han indicado su compromiso con el respeto a los archivos LLMs.txt configurados adecuadamente a medida que el estándar madura. La implementación temprana coloca a las marcas por delante de la curva de cumplimiento.
Cuando los usuarios preguntan a los sistemas de IA "mejor rutina de cuidado de la piel para piel grasa", "botas de senderismo más duraderas para pies anchos" o "máquina de espresso asequible para principiantes", estas consultas extraen de los índices de contenido existentes de los rastreadores de IA. Las marcas que no han configurado LLMs.txt están dejando su visibilidad en IA al azar; los rastreadores de IA pueden estar accediendo a URLs de categoría paginadas de bajo valor, páginas de productos desactualizadas o áreas de pago sensibles al precio en lugar de las descripciones de productos autoritativas, guías de compra y contenido de preguntas frecuentes que realmente impulsarían recomendaciones favorables de IA.
Sin LLMs.txt, un rastreador de IA que visite tu tienda podría indexar:
/collections/shoes?color=red&size=10) que no tienen valor de marca únicoCon LLMs.txt configurado adecuadamente, diriges a los rastreadores de IA hacia:
La implementación de LLMs.txt todavía está en una fase temprana. La mayoría de las marcas de eCommerce aún no han configurado el archivo. Los primeros implementadores que dirigen a los rastreadores de IA hacia su contenido más fuerte y autoritativo tienen una ventaja medible sobre los competidores cuya huella de IA está siendo moldeada por el comportamiento aleatorio de los rastreadores.
Los principales rastreadores de IA para los que configurar reglas en 2026:
| Plataforma de IA | Agente de Usuario del Rastreador |
|---|---|
| ChatGPT (OpenAI) | GPTBot |
| Claude (Anthropic) | ClaudeBot |
| Gemini (Google) | Google-Extended |
| Perplexity | PerplexityBot |
| Meta AI | Meta-ExternalAgent |
| Amazon (Rufus) | Amazonbot |
| Copilot (Microsoft) | Bingbot (Copilot usa el índice de Bing) |
Puedes escribir reglas generales que se apliquen a todos los rastreadores de IA utilizando un agente de usuario comodín, o crear reglas específicas por plataforma que permitan un rastreador mientras restringen a otro — por ejemplo, si deseas que tu contenido alimente la búsqueda en tiempo real de Perplexity pero prefieres no contribuir a los datos de entrenamiento de OpenAI.
Crea un archivo de texto plano llamado llms.txt. Aloja este archivo en la raíz de tu dominio, accesible en tu tienda.com/llms.txt. El formato del archivo utiliza directivas de clave-valor simples, similar a la sintaxis de robots.txt.
Comienza cada bloque de reglas con el rastreador al que te estás dirigiendo:
User-agent: GPTBot
User-agent: ClaudeBot
User-agent: PerplexityBot
User-agent: Google-Extended
Estos son los tipos de contenido más propensos a generar recomendaciones de productos AI precisas y favorables. Las páginas de productos con un esquema integral, contenido de blogs educativos y secciones de Preguntas Frecuentes son los activos de citación de AI de mayor valor para las marcas de comercio electrónico.
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /search
Disallow: /collections/?
La regla final (/collections/*?*) bloquea las URL generadas por filtros: la directiva de desautorización más importante para los sitios de comercio electrónico, ya que las páginas de categoría filtradas representan la mayoría del problema de rastreabilidad de AI.
Dirige a los rastreadores de AI hacia tus activos de datos estructurados más importantes:
Data-source: https://tu tienda.com/sitemap.xml
Data-source: https://tu tienda.com/pages/buying-guide
Data-source: https://tu tienda.com/blogs/product-guides
Estas directivas guían a los sistemas de AI hacia el contenido que más deseas que se cite en las respuestas sobre el descubrimiento de productos.
User-agent: GPTBot
Allow: /products/
Allow: /collections/
Allow: /blogs/
Allow: /pages/faq
Allow: /pages/about
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /search
Disallow: /collections/?
Data-source: https://tu tienda.com/sitemap.xml
Data-source: https://tu tienda.com/blogs/product-guides
User-agent: PerplexityBot
Allow: /products/
Allow: /blogs/
Allow: /pages/faq
Disallow: /cart
Disallow: /checkout
Disallow: /collections/?
Data-source: https://tu tienda.com/sitemap.xml
Shopify: Shopify no soporta de manera nativa las cargas de archivos a nivel de raíz fuera de archivos específicos en la lista blanca. Las opciones de implementación incluyen: (1) un trabajo de redirección de URL que redirija /llms.txt a un archivo alojado, (2) una aplicación proxy que genere y sirva el archivo a través de la infraestructura de Shopify, o (3) aplicaciones de terceros en la tienda de aplicaciones de Shopify específicamente construidas para la gestión de LLMs.txt.
WooCommerce (WordPress): Sube llms.txt directamente al directorio raíz de tu sitio a través de SFTP o del panel de control de alojamiento. Algunos plugins de SEO, incluyendo Yoast SEO y Rank Math, están comenzando a añadir funciones nativas de generación de LLMs.txt en 2026.
Magento / Plataformas personalizadas: Sube el archivo directamente al directorio raíz público. Asegúrate de que la configuración de tu servidor web no bloquee el acceso a archivos .txt en el directorio raíz; algunas configuraciones de seguridad bloquean archivos raíz no estándar.
Siempre permitir:
/products/[slug]) con marcado de esquema completoSiempre bloquear:
/search?q=)/collections/shoes?color=red)Considerar caso por caso:
Configurar LLMs.txt no es una configuración única. El monitoreo continuo es esencial para verificar que el archivo esté funcionando como se esperaba y para adaptarse a medida que tu sitio y el panorama de plataformas de IA evolucionen.
Rastrear la actividad del rastreador de IA en los registros del servidor. Busca solicitudes de los agentes de usuario GPTBot, ClaudeBot, PerplexityBot y Google-Extended. Monitorea qué URLs están accediendo estos rastreadores — si ves actividad de rastreo en rutas no permitidas, verifica la sintaxis de tu archivo y la configuración del servidor.
Usa el monitoreo de visibilidad de IA para verificar patrones de citación. La verdadera prueba de la efectividad de LLMs.txt no son los registros de acceso del rastreador — es si los sistemas de IA están citando el contenido correcto de tu sitio. Las plataformas que monitorean cuáles de tus páginas están siendo citadas en recomendaciones de productos de IA (y qué páginas de competidores están siendo citadas en su lugar) proporcionan el bucle de retroalimentación que valida tu estrategia de LLMs.txt.
Actualiza el archivo cuando ocurran cambios significativos en el contenido:

LLMs.txt controla a qué pueden acceder los rastreadores de IA, pero por sí solo no puede decirte si ese acceso se traduce en recomendaciones de compra de IA favorables. El bucle de retroalimentación entre tu configuración de LLMs.txt y tus resultados de citación de IA reales requiere una capa de monitoreo que LLMs.txt por sí solo no puede proporcionar. Dageno AI cierra esta brecha.
Dageno AI monitorea continuamente cómo los sistemas de IA están representando tu marca y productos en ChatGPT, Perplexity, Gemini, Google AI Mode, Claude y otras plataformas principales, revelando qué páginas de productos están siendo citadas, qué atributos están describiendo los sistemas de IA y dónde existen inexactitudes o brechas. Para los equipos de eCommerce que utilizan LLMs.txt para dirigir a los rastreadores de IA hacia contenido específico, Dageno AI verifica si esa dirección está funcionando: ¿las páginas de productos que has permitido en LLMs.txt realmente están generando más citaciones de IA? ¿Las páginas que has bloqueado aún aparecen en las respuestas de IA (lo que podría indicar un camino de citación diferente — como un sitio de reseñas de terceros)? ¿El contenido del producto al que acceden los rastreadores de IA se está representando de manera precisa en las respuestas de compra de IA, o hay errores en los atributos que necesitan corrección?
La extensión AI Search Analyzer de Dageno AI también proporciona validación en la página, comprobando que las páginas que pretendes permitir en tu configuración de LLMs.txt son técnicamente accesibles, están estructuradas correctamente y son válidas en esquema. Esto asegura que tu estrategia de LLMs.txt esté construida sobre páginas que los sistemas de IA realmente pueden analizar y utilizar de manera efectiva.
Ve cómo Dageno AI monitorea la visibilidad de compras de IA →
¿Listo para dominar la búsqueda de IA?
Comienza ahora - ¡es gratis! >Bloquear accidentalmente tus páginas de producto. Una regla amplia Disallow: /collections/ que no excepciona adecuadamente las páginas de productos clave es el error de configuración más dañino para los sitios de eCommerce. Siempre verifica con una simulación de rastreador que tus páginas de alto valor previstas sean accesibles.
Reglas en conflicto entre robots.txt y LLMs.txt. Si una página está bloqueada en robots.txt pero permitida en LLMs.txt, el comportamiento del rastreador se vuelve impredecible. Alinea ambos archivos en torno a una estrategia coherente de visibilidad de contenido.
No incluir directivas de fuente de datos. Muchas marcas configuran reglas de Allow/Disallow pero omiten referencias de fuente de datos, perdiendo la oportunidad de guiar activamente a los sistemas de IA hacia sus activos de contenido más fuertes.
Configuración y olvido. LLMs.txt necesita revisión trimestral como mínimo. Un archivo configurado para tu catálogo de productos del Q1 estará desactualizado para el Q3 sin actualizaciones.

Ye Faye is an SEO and AI growth executive with extensive experience spanning leading SEO service providers and high-growth AI companies, bringing a rare blend of search intelligence and AI product expertise. As a former Marketing Operations Director, he has led cross-functional, data-driven initiatives that improve go-to-market execution, accelerate scalable growth, and elevate marketing effectiveness. He focuses on Generative Engine Optimization (GEO), helping organizations adapt their content and visibility strategies for generative search and AI-driven discovery, and strengthening authoritative presence across platforms such as ChatGPT and Perplexity
Read full bio