Perguntas Frequentes

Question 1

O que é prontidão para IA e porque é que importa?

Accepted Answer

A prontidão para IA mede quão bem o conteúdo do seu site pode ser compreendido, extraído e utilizado por agentes de IA como ChatGPT, Claude e Perplexity. À medida que as ferramentas baseadas em IA se tornam uma fonte importante de tráfego web, os sites prontos para IA são citados com mais precisão, aparecem mais frequentemente em respostas geradas por IA e custam menos tokens a processar.

Question 2

Como é que os agentes de IA consomem conteúdo de forma diferente dos navegadores?

Accepted Answer

Ao contrário dos navegadores web que renderizam HTML visualmente, os agentes de IA precisam de extrair conteúdo textual das suas páginas. Preferem conteúdo limpo e bem estruturado em vez de HTML complexo com estilos pesados. Uma página bem estruturada convertida para Markdown utiliza 70-80% menos tokens do que HTML bruto, tornando-a mais barata e eficiente para fornecedores de IA.

Question 3

Que bots e agentes de IA estão atualmente a rastrear a web?

Accepted Answer

Os principais crawlers de IA incluem GPTBot (OpenAI/ChatGPT), ClaudeBot (Anthropic/Claude), PerplexityBot (Perplexity), Google-Extended (Google Gemini), Bytespider (ByteDance), CCBot (Common Crawl) e muitos mais. Novos agentes de IA aparecem regularmente à medida que o ecossistema cresce.

Question 4

O que é llms.txt?

Accepted Answer

llms.txt é um padrão emergente (definido em llmstxt.org) que ajuda os agentes de IA a compreender a estrutura do seu site. Semelhante a como o robots.txt guia crawlers de motores de busca, o llms.txt fornece uma visão geral formatada em Markdown do seu site com links para páginas principais, facilitando a navegação dos agentes de IA pelo seu conteúdo.

Question 5

Qual é a diferença entre llms.txt e llms-full.txt?

Accepted Answer

llms.txt é um índice conciso com uma descrição e links para as páginas principais do seu site. llms-full.txt é uma versão estendida que inclui o conteúdo real dessas páginas inline, dando aos agentes de IA tudo num único ficheiro sem precisar de seguir links. Use llms.txt como mínimo e llms-full.txt para cobertura completa.

Question 6

Como crio um llms.txt para o meu site?

Accepted Answer

Crie um ficheiro de texto na raiz do seu domínio (ex.: example.com/llms.txt) seguindo a especificação llmstxt.org. Comece com um título # (nome do seu site), adicione uma descrição em blockquote e depois liste links organizados em secções como ## Documentation e ## Main. O AgentReady pode gerar um llms.txt recomendado com base na análise da sua página.

Question 7

Porque é que o Markdown é importante para agentes de IA?

Accepted Answer

O Markdown é o formato preferido dos agentes de IA porque preserva a estrutura do conteúdo (títulos, listas, links, ênfase) eliminando o ruído de markup visual (CSS, JavaScript, divs de layout). Uma versão Markdown do seu conteúdo utiliza significativamente menos tokens, tornando o processamento por sistemas de IA mais rápido e barato.

Question 8

O que é negociação de conteúdo Markdown?

Accepted Answer

A negociação de conteúdo permite que o seu servidor sirva diferentes formatos da mesma página com base no cabeçalho Accept do cliente. Quando um agente de IA envia Accept: text/markdown, o seu servidor pode responder com uma versão Markdown em vez de HTML. Esta é a forma mais eficiente de servir conteúdo amigável para IA sem criar URLs separados.

Question 9

Como sirvo versões Markdown das minhas páginas?

Accepted Answer

Existem duas abordagens principais: (1) Adicionar lógica no servidor para detetar cabeçalhos Accept: text/markdown e devolver conteúdo Markdown; (2) Criar ficheiros .md junto às suas páginas (ex.: /about.md para /about) e ligá-los no seu llms.txt. O AgentReady utiliza ambas as abordagens para as suas próprias páginas.

Question 10

O que é JSON-LD e como ajuda os agentes de IA?

Accepted Answer

JSON-LD (JavaScript Object Notation for Linked Data) é uma forma de incorporar dados estruturados nas suas páginas usando o vocabulário Schema.org. Os agentes de IA usam estes dados para extrair informação factual e legível por máquina como detalhes de produtos, metadados de artigos, informação de organizações e mais — sem precisar de analisar o seu HTML.

Question 11

Que tipos Schema.org devo usar?

Accepted Answer

Use o tipo mais específico que corresponda ao seu conteúdo: Article ou BlogPosting para artigos, Product para páginas de produtos, Organization para páginas de empresa, FAQPage para páginas FAQ, LocalBusiness para negócios locais e WebApplication para ferramentas web. Inclua sempre name, description e propriedades relevantes para o tipo escolhido.

Question 12

Como é que as tags Open Graph ajudam os agentes de IA?

Accepted Answer

As tags Open Graph (og:title, og:description, og:image) fornecem metadados padronizados que tanto plataformas sociais como agentes de IA usam para compreender o título, descrição e imagem principal da sua página. São fáceis de implementar e servem como fallback fiável quando outros dados estruturados estão em falta.

Question 13

Como é que o robots.txt afeta crawlers de IA?

Accepted Answer

O robots.txt controla que bots podem aceder ao seu site e que páginas podem rastrear. Crawlers de IA como GPTBot e ClaudeBot respeitam as diretivas robots.txt. Se o seu robots.txt bloquear estes bots, eles não poderão indexar o seu conteúdo, o que significa que o seu site não aparecerá em respostas geradas por IA.

Question 14

Que bots de IA devo permitir no robots.txt?

Accepted Answer

Para maximizar a visibilidade em respostas geradas por IA, permita pelo menos: GPTBot (OpenAI), ClaudeBot e Claude-Web (Anthropic), PerplexityBot (Perplexity) e Google-Extended (Google Gemini). Pode adicionar regras Allow específicas para estes user agents mantendo as suas regras existentes para outros bots.

Question 15

O que são cabeçalhos Content-Signal?

Accepted Answer

Content-Signal é um cabeçalho HTTP que indica aos agentes de IA como podem usar o seu conteúdo. Por exemplo: Content-Signal: ai-train=yes, search=yes, ai-input=yes sinaliza que o seu conteúdo pode ser usado para treino de IA, indexação de pesquisa e como entrada para respostas de IA. É um padrão mais recente que dá aos editores controlo explícito sobre o uso por IA.

Question 16

Como funciona o sistema de pontuação do AgentReady?

Accepted Answer

O AgentReady obtém a sua página, extrai o conteúdo e executa 23 verificações individuais em 5 dimensões ponderadas. Cada verificação pontua de 0 a 100, e as dimensões são combinadas numa pontuação global de 0 a 100. Recebe uma nota por letra (A-F), uma análise detalhada e recomendações priorizadas para melhorar a sua pontuação.

Question 17

Quais são as 5 dimensões de pontuação?

Accepted Answer

As 5 dimensões são: HTML Semântico (15%) — uso adequado de article, main, títulos e elementos semânticos; Eficiência de Conteúdo (10%) — rácio de redução de tokens e rácio conteúdo-ruído; Descobribilidade IA (25%) — llms.txt, robots.txt, sitemap e negociação markdown; Dados Estruturados (20%) — Schema.org, Open Graph e meta tags; Acessibilidade (30%) — conteúdo sem JavaScript, tamanho da página e posição do conteúdo.

Question 18

A análise é gratuita?

Accepted Answer

Sim! A análise de página única é completamente gratuita e sem necessidade de registo. Obtém a pontuação completa, recomendações, conversão Markdown e pré-visualização llms.txt. Estamos atualmente em beta com um limite de 5 análises por hora. Rastreamento completo de domínio e funcionalidades de monitorização estão a chegar em breve.

Question 19

Que bots de IA verificam e porque mudou a lista?

Accepted Answer

Verificamos 18 rastreadores, e cada um liga à documentação oficial do seu fabricante. Em julho de 2026 refizemos a lista. Retirámos três: Claude-Web e FacebookBot já não constam da documentação da Anthropic nem da Meta, e cohere-ai nunca esteve documentado — estávamos a recomendar nomear bots que não existem. Também acrescentámos os que faltavam, entre eles o OAI-SearchBot, o rastreador que realmente coloca o seu site nos resultados de pesquisa do ChatGPT. Circulam listas de terceiros com user-agents inventados (os de xAI/Grok são um caso conhecido). Aqui, um bot só aparece se o fabricante o documentar.

Question 20

Bloquear o GPTBot prejudica a minha visibilidade no ChatGPT?

Accepted Answer

Não — e esta distinção é o mais útil desta página. Os fabricantes separam os rastreadores por finalidade. Os de treino (GPTBot, ClaudeBot, Google-Extended) leem as suas páginas para treinar modelos: bloqueá-los não lhe custa visibilidade nenhuma. Os de pesquisa (OAI-SearchBot, Claude-SearchBot, PerplexityBot) constroem o índice de onde o assistente cita: bloqueie um e desaparece desse assistente. Os de utilizador (ChatGPT-User, Claude-User) pedem uma página porque alguém a está a pedir agora. Pode recusar o treino e continuar a ser citado em todo o lado — mas apenas se permitir os de pesquisa. Agora etiquetamos cada rastreador por tipo para que escolha conscientemente em vez de bloquear tudo com um caráter universal.

Question 21

Onde devem ficar o meu agent card de A2A e o meu server card de MCP?

Accepted Answer

O agent card de A2A fica em /.well-known/agent-card.json. Foi movido para ali no A2A v0.3.0 (agosto de 2025) e a v1.0 mantém-no; /.well-known/agent.json é um alias obsoleto que os SDK ainda servem para clientes antigos. Nós verificávamos — e gerávamos — o caminho antigo, o que significava publicar um descritor onde os agentes atuais não olham. Já está corrigido. Quanto ao MCP, a resposta honesta é que não há caminho padrão: a especificação do MCP não define qualquer ficheiro well-known de descoberta, e os server cards continuam a ser um rascunho aberto (SEP-1649) que propõe /.well-known/mcp/server-card.json. Sondamos esse e também a convenção antiga mcp.json, e etiquetamo-los como rascunho em vez de fingir o contrário. O que a especificação do MCP exige mesmo é /.well-known/oauth-protected-resource (RFC 9728) — agora verificamo-lo.

Question 22

Por que os pesos da pontuação mudaram em julho de 2026?

Accepted Answer

Porque a rubrica premiava o que é fácil de verificar, e não o que conseguimos demonstrar que importa. O llms.txt — uma proposta que nenhum fornecedor grande se comprometeu a implementar — pesava mais do que o Schema.org, que todos os assistentes realmente interpretam. A rubrica v2 obriga cada uma das 23 verificações a declarar a sua evidência: comprovada (o fornecedor documenta que lê isto), plausível (prática consolidada da web, mas sem declaração do fornecedor sobre IA) ou especulativa (uma aposta razoável, nada mais). Os pesos seguem essa classificação: o comprovado vale agora 32 dos 100 pontos, o plausível 51 e o especulativo 17. Continuamos a verificar o llms.txt — publicá-lo não custa nada e pode vir a importar — mas já não pesa mais do que os sinais que comprovadamente funcionam. Cada resultado regista a versão da rubrica que o produziu, de modo que uma pontuação antiga pode ser lida com as regras com que foi medida.

Question 23

Verificam se os crawlers de IA conseguem mesmo chegar ao meu site?

Accepted Answer

Agora medimos, e isso expôs um buraco na nossa própria pontuação. Todas as outras verificações leem uma declaração: o seu robots.txt diz que os crawlers podem passar, por isso atribuíamos os pontos. Mas o robots.txt é servido pela sua origem, e o pedido nunca lá chega — o seu CDN ou WAF responde primeiro, e não tem de concordar. A Cloudflare começou a bloquear crawlers de IA por predefinição no edge a 15 de setembro de 2026. Um site podia publicar um robots.txt impecável, estar fechado a todos os assistentes e obter a nota máxima connosco. Por isso deixámos de ler e começámos a medir: pedimos a sua página como cliente comum, pedimo-la de novo identificando-nos como OAI-SearchBot e comparamos. O que conseguimos provar tem limites, e preferimos dizê-lo a afirmar demais. A nossa sonda parte dos nossos servidores, e os edges verificam os crawlers por endereço IP, não pelo nome — portanto uma recusa pode visar impostores enquanto o crawler verificado passa. Relatamos exatamente o que vimos e apontamos-lhe as suas regras de bots. Não lhe dizemos que está bloqueado no ChatGPT, porque de fora não podemos saber isso.

Perguntas Frequentes

Noções básicas de prontidão para IA

llms.txt

Markdown para IA

Dados Estruturados & JSON-LD

robots.txt & Bots de IA

Pontuação AgentReady

O que mudou

Recursos úteis