Perguntas Frequentes
Tudo o que precisa de saber sobre prontidão para IA, llms.txt e como otimizar o seu site para agentes de IA.
Noções básicas de prontidão para IA
A prontidão para IA mede quão bem o conteúdo do seu site pode ser compreendido, extraído e utilizado por agentes de IA como ChatGPT, Claude e Perplexity. À medida que as ferramentas baseadas em IA se tornam uma fonte importante de tráfego web, os sites prontos para IA são citados com mais precisão, aparecem mais frequentemente em respostas geradas por IA e custam menos tokens a processar.
Ao contrário dos navegadores web que renderizam HTML visualmente, os agentes de IA precisam de extrair conteúdo textual das suas páginas. Preferem conteúdo limpo e bem estruturado em vez de HTML complexo com estilos pesados. Uma página bem estruturada convertida para Markdown utiliza 70-80% menos tokens do que HTML bruto, tornando-a mais barata e eficiente para fornecedores de IA.
Os principais crawlers de IA incluem GPTBot (OpenAI/ChatGPT), ClaudeBot (Anthropic/Claude), PerplexityBot (Perplexity), Google-Extended (Google Gemini), Bytespider (ByteDance), CCBot (Common Crawl) e muitos mais. Novos agentes de IA aparecem regularmente à medida que o ecossistema cresce.
llms.txt
llms.txt é um padrão emergente (definido em llmstxt.org) que ajuda os agentes de IA a compreender a estrutura do seu site. Semelhante a como o robots.txt guia crawlers de motores de busca, o llms.txt fornece uma visão geral formatada em Markdown do seu site com links para páginas principais, facilitando a navegação dos agentes de IA pelo seu conteúdo.
llms.txt é um índice conciso com uma descrição e links para as páginas principais do seu site. llms-full.txt é uma versão estendida que inclui o conteúdo real dessas páginas inline, dando aos agentes de IA tudo num único ficheiro sem precisar de seguir links. Use llms.txt como mínimo e llms-full.txt para cobertura completa.
Crie um ficheiro de texto na raiz do seu domínio (ex.: example.com/llms.txt) seguindo a especificação llmstxt.org. Comece com um título # (nome do seu site), adicione uma descrição em blockquote e depois liste links organizados em secções como ## Documentation e ## Main. O AgentReady pode gerar um llms.txt recomendado com base na análise da sua página.
Markdown para IA
O Markdown é o formato preferido dos agentes de IA porque preserva a estrutura do conteúdo (títulos, listas, links, ênfase) eliminando o ruído de markup visual (CSS, JavaScript, divs de layout). Uma versão Markdown do seu conteúdo utiliza significativamente menos tokens, tornando o processamento por sistemas de IA mais rápido e barato.
A negociação de conteúdo permite que o seu servidor sirva diferentes formatos da mesma página com base no cabeçalho Accept do cliente. Quando um agente de IA envia Accept: text/markdown, o seu servidor pode responder com uma versão Markdown em vez de HTML. Esta é a forma mais eficiente de servir conteúdo amigável para IA sem criar URLs separados.
Existem duas abordagens principais: (1) Adicionar lógica no servidor para detetar cabeçalhos Accept: text/markdown e devolver conteúdo Markdown; (2) Criar ficheiros .md junto às suas páginas (ex.: /about.md para /about) e ligá-los no seu llms.txt. O AgentReady utiliza ambas as abordagens para as suas próprias páginas.
Dados Estruturados & JSON-LD
JSON-LD (JavaScript Object Notation for Linked Data) é uma forma de incorporar dados estruturados nas suas páginas usando o vocabulário Schema.org. Os agentes de IA usam estes dados para extrair informação factual e legível por máquina como detalhes de produtos, metadados de artigos, informação de organizações e mais — sem precisar de analisar o seu HTML.
Use o tipo mais específico que corresponda ao seu conteúdo: Article ou BlogPosting para artigos, Product para páginas de produtos, Organization para páginas de empresa, FAQPage para páginas FAQ, LocalBusiness para negócios locais e WebApplication para ferramentas web. Inclua sempre name, description e propriedades relevantes para o tipo escolhido.
As tags Open Graph (og:title, og:description, og:image) fornecem metadados padronizados que tanto plataformas sociais como agentes de IA usam para compreender o título, descrição e imagem principal da sua página. São fáceis de implementar e servem como fallback fiável quando outros dados estruturados estão em falta.
robots.txt & Bots de IA
O robots.txt controla que bots podem aceder ao seu site e que páginas podem rastrear. Crawlers de IA como GPTBot e ClaudeBot respeitam as diretivas robots.txt. Se o seu robots.txt bloquear estes bots, eles não poderão indexar o seu conteúdo, o que significa que o seu site não aparecerá em respostas geradas por IA.
Para maximizar a visibilidade em respostas geradas por IA, permita pelo menos: GPTBot (OpenAI), ClaudeBot e Claude-Web (Anthropic), PerplexityBot (Perplexity) e Google-Extended (Google Gemini). Pode adicionar regras Allow específicas para estes user agents mantendo as suas regras existentes para outros bots.
Content-Signal é um cabeçalho HTTP que indica aos agentes de IA como podem usar o seu conteúdo. Por exemplo: Content-Signal: ai-train=yes, search=yes, ai-input=yes sinaliza que o seu conteúdo pode ser usado para treino de IA, indexação de pesquisa e como entrada para respostas de IA. É um padrão mais recente que dá aos editores controlo explícito sobre o uso por IA.
Pontuação AgentReady
O AgentReady obtém a sua página, extrai o conteúdo e executa 21 verificações individuais em 5 dimensões ponderadas. Cada verificação pontua de 0 a 100, e as dimensões são combinadas numa pontuação global de 0 a 100. Recebe uma nota por letra (A-F), uma análise detalhada e recomendações priorizadas para melhorar a sua pontuação.
As 5 dimensões são: HTML Semântico (20%) — uso adequado de article, main, títulos e elementos semânticos; Eficiência de Conteúdo (25%) — rácio de redução de tokens e rácio conteúdo-ruído; Descobribilidade IA (25%) — llms.txt, robots.txt, sitemap e negociação markdown; Dados Estruturados (15%) — Schema.org, Open Graph e meta tags; Acessibilidade (15%) — conteúdo sem JavaScript, tamanho da página e posição do conteúdo.
Sim! A análise de página única é completamente gratuita e sem necessidade de registo. Obtém a pontuação completa, recomendações, conversão Markdown e pré-visualização llms.txt. Estamos atualmente em beta com um limite de 5 análises por hora. Rastreamento completo de domínio e funcionalidades de monitorização estão a chegar em breve.
Recursos úteis
- llmstxt.org — llms.txt specification
- schema.org — Schema.org vocabulary
- w3.org/TR/json-ld11 — W3C JSON-LD specification
- ogp.me — Open Graph Protocol
- robotstxt.org — robots.txt standard
- commonmark.org — CommonMark Markdown specification
- RFC 7231 — HTTP Content Negotiation