Pagina scansionata, ma attualmente non indicizzata

Lo stato “Scansionata, ma attualmente non indicizzata”, indica che “La pagina è stata sottoposta a scansione da Google, ma non indicizzata. In futuro la pagina potrebbe essere indicizzata o meno, ma non è necessario inviare di nuovo l’URL per la scansione.”

Burney Gumble

La definizione che hai appena letto è presa dalle linee guida di Google ed è autoesplicativa: Google ha letto il tuo contenuto, ma non gli è piaciuto abbastanza da dedicargli spazio nel suo indice. Un bel due di picche, in pratica.

Per fortuna possiamo rimetterci in forma e diventare belli agli occhi di Google. In questo articolo ti spiego come. Cominciamo!

Significato e come risolvere il problema

L’indicizzazione di una pagina, o crawling, è il processo con cui Google scansiona i link e legge i contenuti di un sito web. Una volta scansionata correttamente, la pagina viene posizionata in base ad una serie di fattori.

Quando Google Search Console mostra lo stato “Pagina scansionata, ma attualmente non indicizzata“, generalmente il problema sta nei contenuti. Un testo troppo corto, scritto male e di difficile comprensione, o ancora strutturato in maniera disorganizzata o senza link interni, può generare questo stato.

Per fare in modo che Google indicizzi la pagina, di solito lavoro su questi fattori:

Qualità del contenuto

La qualità del contenuto è l’aspetto più importante da considerare. Non esiste un parametro oggettivo per definire la qualità, e la stessa Google non va a dare una definizione univoca e facilmente applicabile. Inoltre alcuni aspetti che vengono utilizzati per considerare una pagina autorevole e di qualità sono fuori dal nostro diretto controllo, come i link che vengono da altri siti.

Esistono però dei punti base che io seguo per creare un contenuto di qualità:

  • Qualità del testo: lavora sul testo. Fai in modo che sia di semplice lettura, senza errori e che non si parli di argomenti non inerenti. Da qui andiamo diretti al secondo punto;
  • Rispondere all’intento di ricerca: i singoli contenuti devono rispondere all’intento di ricerca. Se il meta Tag Title e il titolo della pagina sono “Come viaggiare da Torino a Milano” e nell’articolo parliamo di quando sia bella Torino rispetto a Milano (eh eh eh), la pagina non risponde all’intento di ricerca;
  • Gestione corretta degli headings: gli headings (H1, H2, H3, ecc.) devono avere un’ordine gerarchico e di importanza rispetto al contenuto. Gli H2 dovranno fare riferimento agli H1, e gli H3 presenti sotto all’H2, dovrà fare riferimento all’H2 corrispondente.

La struttura dei link interni

L’assenza di link all’interno della pagina e una cattiva gestione della link building potrebbero dare vita a questo stato. I link interni sono fondamentali per permettere a Google di navigare all’interno del tuo sito, e gli fanno scovare altre pagine o articoli di approfondimento. Se il bot non trova link interni, potrebbe reputarla “poco interessante” e decidente, nonostante l’abbia letta e scansionata, di non inserirla nell’indice. Dai quindi molta importanta alla link buildig interna.

Problemi tecnici

Anche i problemi tecnici possono generare delle risposte da parte di Google che non ci piacciono, anche se tendenzialmente gli stati che Google Search Console indica sono differenti. Ad esempio se c’è qualcosa che blocca la scansione, viene indicata con lo stato “Rilevata, ma non indicizzata” oppure con lo stato Esclusa per il tag No Index. In qualsiasi caso è buona norma controllare che non ci sia qualcosa che vada a impedire la lettura della pagina al bot di Google.

Crawl budget non sufficiente

Google ha risorse limitate, e assegna un crawl budget (un budget di risolse da usare per la scansione) ad ogni sito. Se il tuo sito ha tante pagine esistenti, che sono indicizzate, non posizionate (o posizionate male) e non hanno nessun valore all’interno della tua strategia di link building, è probabile che Google vada a dedicare risorse su quelle pagine e non rimanga abbastaza budget da dedicare a quelle nuove.

Valutare se si sta sprecando Crawl Budget è complesso, soprattutto nei siti di grandi dimensioni. Quello che bisogna fare è analizzare le pagine (soprattutto quelle del blog, se è presente nel sito). I vecchi contenuti potrebbero essere migliorati e riscritti, cercando di posizionare una pagina esistente invece di creare una nuova. Se invece la pagina tratta un argomento di poco interesse e che non riguarda più il contenuto del sito, si può decidere di eliminarla dall’indice di Google.

Quanto tempo ci vuole per risolvere il problema

Una volta apportate le dovue modifiche al contenuto, potrai andare a richiedere l’indicizzazione della pagine su Google Search Console. Questo passaggio non è obbligatorio. Se hai creato una struttura di link building interna ben oganizzata, Google dovrebbe tornare in autonomia sulla pagina senza bisogno del tuo intervento. L’operazione potrebbe richiedere un po’ di tempo. Se hai fretta, meglio richiedere una nuova indicizzazione su Google Search Console.

La scansione in qualsiasi caso non avviene in tempo reale, ed è meglio lasciare trascorrere un po’ di tempo prima di controllare nuovamente lo stato della pagina e apportare nuove ottimizzazioni. Non esiste un tempo preciso che si può indicare: a volte il processo richiede qualche ora o qualche giorno, altre volte qualche settimana. Il mio consiglio è di lasciar passare dai 7 ai 15 giorni prima di tornare a lavorare sul contenuto.

Gli stati di Google Search Console

Come forse avrai notato, non ho mai parlato di errore, ma di stato. La differenza è sottime ma molto importante, e ti spiego il perchè.

Un errore indica qualcosa che va risolto in tempi più o meno brevi. Ad esempio l’errore 503, cioè l’errore di un server sovraccaricato (il problema più temuto dai proprietari di siti web), indica che il server non visualizza i contenuti: in pratica il tuo sito non è accessibile da nessuno.

Lo “stato” invece è il comportamento che Google ha dopo aver trovato una pagina. Uno stato non necessariamente indica un problema, ma semplicemente ti dice cosa Google fa rispetto a quel contenuto. Ad esempio lo stato “Esclusa in base al tag No Index“, se viene visualizzato in Search Console su una pagina a cui abbiamo assegnato il tag no index volontariamente perchè non vogliamo venga indicizzata, è un segnale corretto.

Gli stati che possiamo trovare su Google Search Console sono poco meno di una ventina, e hanno tutti un significato specifico, più o meno chiaro. Si dividono in due grosse macroaree, cioè “Indicizzati” e “Non indicizzate“. L’unico stato presente nella prima macroarea è “La pagina è indicizzata” che generalmente è la scritta più bella che si possa trovare nella sezione “Pagine” di Google Search Console. Nella macroarea “Non indicizzati” abbiamo il resto degli stati. I più importanti sono:

  • Scansionata, ma attualmente non indicizzata
  • Rilevata, ma attualmente non indicizzata
  • Esclusa in base al tag No Index
  • Indicizzata ma bloccata da robots.txt
  • Pagina con errore 404

Conclusione

Lo stato “Scansionata, ma non indicizzata” è risolvibile con il giusto approggio e le modifiche appropriate. Se segui le indicazioni indicate in questo articolo, è molto probabile che tu riesca a risolvere in autonomia. Se però hai qualche dubbio su uno stato presente su Google Search Console o vuoi approfondire qualche aspetto, lascia un commento.

A presto,
Matteo

Altri articoli:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *