Indicizzazione e posizionamento: quando si parla di siti web e in particolare di SEO, questi sono i termini principali che sentiamo sempre nominare. Ma occorre fare una distinzione in quanto troppo spesso vengono utilizzati erroneamente come sinonimi. L’indicizzazione di un sito è condizione essenziale affinché questo si posizioni per una data query di ricerca, per sintetizzare se un sito non è indicizzato è come se non esistesse agli occhi dei motori di ricerca.
Ma vediamo come indicizzare un sito web e come funziona più in generale il processo di indicizzazione.
L’indicizzazione delle pagine di un sito web avviene in automatico, ma ci sono casi in cui è possibile riscontrare dei problemi, ovvero le pagine di un sito mancano totalmente o parzialmente dall’indice di Google e/o degli altri motori di ricerca.
Contenuti
Come indicizzare un sito web: i termini tecnici
Come detto precedentemente, esiste una piccola differenza tra due termini che spesso vengono utilizzati e confusi tra loro: stiamo parlando dell’indicizzazione e del ranking (o posizionamento). La prima indica che le pagine di un sito web sono state “catalogate” all’interno degli indici del motore di ricerca e riguarda la probabilità che possano comparire in SERP tra i risultati di ricerca; mentre il posizionamento è la reale possibilità che le pagine vadano a comparire tra i risultati di una ricerca. Tutto ciò perché lo spider del motore di ricerca scansiona tutte le pagine web presenti nel suo indice (quindi indicizzate) e raccoglie quelle che possono dare un risultato corretto e soddisfacente ed in seconda istanza, restituisce all’utente che ha effettuato la ricerca solo quelle che possono avere un risultato affine con quanto richiesto.
Lo spider, o Googlebot, è il software che avvia la scansione delle pagine e che in base a determinate regole include o meno le pagine negli indici. In pratica possiamo riassumere il tutto in queste 4 fasi:
- Scansione delle pagine web
- Indicizzazione delle pagine web
- Ricerca dell’utente
- Restituzione dei risultati
Come indicizzare un sito: alcuni consigli
L’indicizzazione di una nuova pagina web dovrebbe avvenire in tempo reale, ma in alcuni casi possiamo assicurarci che questo processo avvenga rapidamente, attraverso delle semplici operazioni:
La prima regola per far sì che il motore di ricerca rilevi il nostro sito, è quella di farsi linkare da un sito autorevole o ben indicizzato: il collegamento che si viene ad effettuare aiuterà l’indicizzazione e il posizionamento del vostro sito. Vale anche in senso contrario, ovvero linkare un sito autorevole e indicizzato. Un altro importante passo per l’indicizzazione è la creazione di una sitemap e la sua sottomissione ai motori di ricerca (nel caso di Google attraverso Search Console). Può essere creata sia manualmente che automaticamente (attraverso alcuni plugin) e aiuterà lo spider a capire quali contenuti sono presenti sul tuo sito e qual è la loro rilevanza.
Verifica dell’indicizzazione di un sito
Per verificare se un sito web è indicizzato e nel dettaglio capire quante e quali pagine basta effettuare su Google la seguente ricerca
In questo caso il motore ci comunica che ha indicizzato 1.410.000 pagine del dominio amazon.it. Qualora il risultato fosse 0 significa che il sito non è indicizzato, vediamo quali potrebbero essere le cause.
Come indicizzare un sito web: gli errori da evitare
Spesso alcuni problemi di posizionamento derivano da banali errori che bloccano l’indicizzazione dell’intero sito o di alcune pagine. Se il nostro sito non compare sui motori di ricerca, prima di pensare a una possibile penalizzazione, controlliamo che il file robots.txt e i meta robots siano scritti correttamente. Attraverso il file robots.txt infatti è possibile bloccare l’indicizzazione di alcune pagine, cartelle, sezioni del sito; viene ad esempio utilizzato per impedire l’indicizzazione delle pagine di back-end o sezioni che si vogliono tenere nascoste.
Disallow: /
In questo caso ad esempio comunichiamo a tutti i motori di ricerca di bloccare la scansione (disallow) dell’intero sito
Attraverso i meta robots possiamo invece definire per ogni pagina del sito se questa deve essere indicizzata e se vogliamo che il motore segua tutti i link presenti al suo interno.
<meta name=”robots” content=”noindex,nofollow”>
In questo caso stiamo impedendo l’indicizzazione (noidex) della pagina.