Domande frequenti
Tutto quello che devi sapere sulla prontezza IA, llms.txt e come ottimizzare il tuo sito web per gli agenti IA.
Fondamenti di prontezza IA
La prontezza IA misura quanto bene i contenuti del tuo sito web possono essere compresi, estratti e utilizzati dagli agenti IA come ChatGPT, Claude e Perplexity. Poiché gli strumenti basati sull'IA stanno diventando una fonte importante di traffico web, i siti pronti per l'IA vengono citati con maggiore precisione, appaiono più spesso nelle risposte generate dall'IA e costano meno token da elaborare.
A differenza dei browser web che renderizzano l'HTML visivamente, gli agenti IA devono estrarre il contenuto testuale dalle tue pagine. Preferiscono contenuti puliti e ben strutturati rispetto a HTML complesso con stili pesanti. Una pagina ben strutturata convertita in Markdown utilizza il 70-80% di token in meno rispetto all'HTML grezzo, rendendola più economica ed efficiente per i fornitori di IA.
I principali crawler IA includono GPTBot (OpenAI/ChatGPT), ClaudeBot (Anthropic/Claude), PerplexityBot (Perplexity), Google-Extended (Google Gemini), Bytespider (ByteDance), CCBot (Common Crawl) e molti altri. Nuovi agenti IA appaiono regolarmente man mano che l'ecosistema cresce.
llms.txt
llms.txt è uno standard emergente (definito su llmstxt.org) che aiuta gli agenti IA a comprendere la struttura del tuo sito web. Simile a come robots.txt guida i crawler dei motori di ricerca, llms.txt fornisce una panoramica formattata in Markdown del tuo sito con link alle pagine principali, facilitando la navigazione degli agenti IA nei tuoi contenuti.
llms.txt è un indice conciso con una descrizione e link alle pagine principali del tuo sito. llms-full.txt è una versione estesa che include il contenuto effettivo di quelle pagine inline, dando agli agenti IA tutto in un singolo file senza dover seguire link. Usa llms.txt come minimo e llms-full.txt per una copertura completa.
Crea un file di testo nella radice del tuo dominio (es. example.com/llms.txt) seguendo la specifica llmstxt.org. Inizia con un titolo # (nome del tuo sito), aggiungi una descrizione in blockquote, poi elenca i link organizzati in sezioni come ## Documentation e ## Main. AgentReady può generare un llms.txt raccomandato basato sull'analisi della tua pagina.
Markdown per l'IA
Il Markdown è il formato preferito dagli agenti IA perché preserva la struttura del contenuto (intestazioni, elenchi, link, enfasi) eliminando il rumore del markup visuale (CSS, JavaScript, div di layout). Una versione Markdown dei tuoi contenuti utilizza significativamente meno token, rendendo l'elaborazione da parte dei sistemi IA più veloce e economica.
La negoziazione dei contenuti consente al tuo server di servire diversi formati della stessa pagina in base all'header Accept del client. Quando un agente IA invia Accept: text/markdown, il tuo server può rispondere con una versione Markdown invece che HTML. Questo è il modo più efficiente per servire contenuti compatibili con l'IA senza creare URL separati.
Ci sono due approcci principali: (1) Aggiungere logica al server per rilevare gli header Accept: text/markdown e restituire contenuto Markdown; (2) Creare file .md accanto alle tue pagine (es. /about.md per /about) e linkarli nel tuo llms.txt. AgentReady utilizza entrambi gli approcci per le proprie pagine.
Dati Strutturati e JSON-LD
JSON-LD (JavaScript Object Notation for Linked Data) è un modo per incorporare dati strutturati nelle tue pagine usando il vocabolario Schema.org. Gli agenti IA usano questi dati per estrarre informazioni fattuali e leggibili dalle macchine come dettagli prodotto, metadati degli articoli, informazioni sulle organizzazioni e altro — senza dover analizzare il tuo HTML.
Usa il tipo più specifico che corrisponde al tuo contenuto: Article o BlogPosting per articoli, Product per pagine prodotto, Organization per pagine aziendali, FAQPage per pagine FAQ, LocalBusiness per attività locali e WebApplication per strumenti web. Includi sempre name, description e proprietà rilevanti per il tipo scelto.
I tag Open Graph (og:title, og:description, og:image) forniscono metadati standardizzati che sia le piattaforme social che gli agenti IA usano per comprendere titolo, descrizione e immagine principale della tua pagina. Sono facili da implementare e servono come fallback affidabile quando mancano altri dati strutturati.
robots.txt e Bot IA
robots.txt controlla quali bot possono accedere al tuo sito e quali pagine possono scansionare. I crawler IA come GPTBot e ClaudeBot rispettano le direttive robots.txt. Se il tuo robots.txt blocca questi bot, non potranno indicizzare i tuoi contenuti, il che significa che il tuo sito non apparirà nelle risposte generate dall'IA.
Per massimizzare la visibilità nelle risposte generate dall'IA, consenti almeno: GPTBot (OpenAI), ClaudeBot e Claude-Web (Anthropic), PerplexityBot (Perplexity) e Google-Extended (Google Gemini). Puoi aggiungere regole Allow specifiche per questi user agent mantenendo le regole esistenti per altri bot.
Content-Signal è un header HTTP che indica agli agenti IA come possono usare i tuoi contenuti. Ad esempio: Content-Signal: ai-train=yes, search=yes, ai-input=yes segnala che i tuoi contenuti possono essere usati per l'addestramento IA, l'indicizzazione per la ricerca e come input per risposte IA. È uno standard più recente che dà agli editori il controllo esplicito sull'uso da parte dell'IA.
Punteggio AgentReady
AgentReady recupera la tua pagina, estrae il contenuto ed esegue 21 verifiche individuali su 5 dimensioni ponderate. Ogni verifica assegna un punteggio da 0 a 100, e le dimensioni vengono combinate in un punteggio complessivo da 0 a 100. Ricevi un voto in lettere (A-F), un'analisi dettagliata e raccomandazioni prioritarie per migliorare il tuo punteggio.
Le 5 dimensioni sono: HTML Semantico (20%) — uso corretto di article, main, intestazioni ed elementi semantici; Efficienza dei Contenuti (25%) — rapporto di riduzione token e rapporto contenuto-rumore; Scopribilità IA (25%) — llms.txt, robots.txt, sitemap e negoziazione markdown; Dati Strutturati (15%) — Schema.org, Open Graph e meta tag; Accessibilità (15%) — contenuto senza JavaScript, dimensione della pagina e posizione del contenuto.
Sì! L'analisi di singola pagina è completamente gratuita e senza necessità di registrazione. Ottieni il punteggio completo, raccomandazioni, conversione Markdown e anteprima llms.txt. Siamo attualmente in beta con un limite di 5 analisi all'ora. Scansione completa del dominio e funzionalità di monitoraggio in arrivo.
Risorse utili
- llmstxt.org — llms.txt specification
- schema.org — Schema.org vocabulary
- w3.org/TR/json-ld11 — W3C JSON-LD specification
- ogp.me — Open Graph Protocol
- robotstxt.org — robots.txt standard
- commonmark.org — CommonMark Markdown specification
- RFC 7231 — HTTP Content Negotiation