Preguntas Frecuentes

Todo lo que necesitas saber sobre preparación para IA, llms.txt y cómo hacer que tu sitio web funcione con AI agents.

Fundamentos de AI-Readiness

AI-readiness mide lo bien que el contenido de tu sitio web puede ser comprendido, extraído y utilizado por AI agents como ChatGPT, Claude y Perplexity. A medida que las herramientas impulsadas por IA se convierten en una fuente importante de tráfico web, los sitios preparados para IA se citan con más precisión, aparecen más a menudo en las respuestas generadas por IA y cuestan menos tokens de procesar.
A diferencia de los navegadores web que renderizan HTML visualmente, los AI agents necesitan extraer el contenido de texto de tus páginas. Prefieren contenido limpio y bien estructurado frente a HTML complejo con estilos pesados. Una página bien estructurada convertida a Markdown usa un 70-80% menos de tokens que el HTML sin procesar, haciéndola más barata y eficiente para los proveedores de IA.
Los principales crawlers de IA incluyen GPTBot (OpenAI/ChatGPT), ClaudeBot (Anthropic/Claude), PerplexityBot (Perplexity), Google-Extended (Google Gemini), Bytespider (ByteDance), CCBot (Common Crawl) y muchos más. Nuevos AI agents aparecen regularmente a medida que el ecosistema crece.

llms.txt

llms.txt es un estándar emergente (definido en llmstxt.org) que ayuda a los AI agents a comprender la estructura de tu sitio web. Similar a cómo robots.txt guía a los crawlers de motores de búsqueda, llms.txt proporciona un resumen en formato Markdown de tu sitio con enlaces a páginas clave, facilitando a los AI agents la navegación por tu contenido.
llms.txt es un índice conciso con una descripción y enlaces a las páginas principales de tu sitio. llms-full.txt es una versión extendida que incluye el contenido real de esas páginas en línea, dando a los AI agents todo en un solo archivo sin necesidad de seguir enlaces. Usa llms.txt como mínimo, y llms-full.txt para una cobertura completa.
Crea un archivo de texto en la raíz de tu dominio (por ejemplo, ejemplo.com/llms.txt) siguiendo la especificación de llmstxt.org. Empieza con un encabezado # (el nombre de tu sitio), añade una descripción en cita, y luego lista los enlaces organizados en secciones como ## Documentation y ## Main. AgentReady puede generar un llms.txt recomendado basándose en el análisis de tu página.

Markdown para IA

Markdown es el formato preferido por los AI agents porque preserva la estructura del contenido (encabezados, listas, enlaces, énfasis) eliminando el ruido del marcado visual (CSS, JavaScript, divs de layout). Una versión en Markdown de tu contenido usa significativamente menos tokens, haciéndola más rápida y barata de procesar para los sistemas de IA.
La negociación de contenido permite que tu servidor sirva diferentes formatos de la misma página según la cabecera Accept del cliente. Cuando un AI agent envía Accept: text/markdown, tu servidor puede responder con una versión en Markdown en lugar de HTML. Es la forma más eficiente de servir contenido optimizado para IA sin crear URLs separadas.
Hay dos enfoques principales: (1) Añadir lógica en el servidor para detectar cabeceras Accept: text/markdown y devolver contenido en Markdown; (2) Crear archivos .md junto a tus páginas (por ejemplo, /about.md para /about) y enlazarlos desde tu llms.txt. AgentReady usa ambos enfoques para sus propias páginas.

Datos Estructurados y JSON-LD

JSON-LD (JavaScript Object Notation for Linked Data) es una forma de incrustar datos estructurados en tus páginas usando el vocabulario Schema.org. Los AI agents usan estos datos para extraer información factual y legible por máquinas como detalles de productos, metadatos de artículos, información de organizaciones y más, sin necesidad de analizar tu HTML.
Usa el tipo más específico que coincida con tu contenido: Article o BlogPosting para artículos, Product para páginas de productos, Organization para páginas de empresa, FAQPage para páginas de FAQ, LocalBusiness para negocios locales y WebApplication para herramientas web. Incluye siempre name, description y las propiedades relevantes para el tipo elegido.
Las etiquetas Open Graph (og:title, og:description, og:image) proporcionan metadatos estandarizados que tanto las plataformas sociales como los AI agents utilizan para comprender el título, la descripción y la imagen principal de tu página. Son fáciles de implementar y sirven como respaldo fiable cuando faltan otros datos estructurados.

robots.txt y Bots de IA

robots.txt controla qué bots pueden acceder a tu sitio y qué páginas pueden rastrear. Los crawlers de IA como GPTBot y ClaudeBot respetan las directivas de robots.txt. Si tu robots.txt bloquea estos bots, no podrán indexar tu contenido, lo que significa que tu sitio no aparecerá en las respuestas generadas por IA.
Para maximizar la visibilidad en respuestas generadas por IA, permite al menos: GPTBot (OpenAI), ClaudeBot y Claude-Web (Anthropic), PerplexityBot (Perplexity) y Google-Extended (Google Gemini). Puedes añadir reglas Allow específicas para estos user agents manteniendo tus reglas existentes para otros bots.
Content-Signal es una cabecera HTTP que indica a los AI agents cómo pueden usar tu contenido. Por ejemplo: Content-Signal: ai-train=yes, search=yes, ai-input=yes indica que tu contenido puede usarse para entrenamiento de IA, indexación de búsqueda y como entrada para respuestas de IA. Es un estándar más reciente que da a los editores control explícito sobre el uso de IA.

Puntuación de AgentReady

AgentReady obtiene tu página, extrae el contenido y ejecuta 21 comprobaciones individuales en 5 dimensiones ponderadas. Cada comprobación puntua de 0 a 100, y las dimensiones se combinan en una puntuación global de 0 a 100. Obtienes una calificación (A-F), un desglose detallado y recomendaciones priorizadas para mejorar tu puntuación.
Las 5 dimensiones son: HTML Semántico (20%) — uso adecuado de article, main, encabezados y elementos semánticos; Eficiencia del Contenido (25%) — ratio de reducción de tokens y ratio contenido-ruido; Visibilidad para IA (25%) — llms.txt, robots.txt, sitemap y negociación de markdown; Datos Estructurados (15%) — Schema.org, Open Graph y meta tags; Accesibilidad (15%) — contenido sin JavaScript, tamaño de página y posición del contenido.
¡Sí! El análisis de una página es completamente gratuito y sin registro. Obtienes la puntuación completa, recomendaciones, conversión a Markdown y vista previa de llms.txt. Actualmente estamos en beta con un límite de 5 análisis por hora. Las funciones de rastreo de dominio completo y monitorización estarán disponibles próximamente.

Recursos Útiles