File Robots.txt
Il file Robots.txt e l'opzione Meta Name Robot.
Il file Robots.txt ed il Meta Name Robot ti permettono di indicare allo spider di Google e degli altri motori di ricerca di indicizzare o no una pagina e di seguire o no un link.
In questo articolo ti illustreremo come utilizzare il file Robots.txt e il Meta Name Robot per tale scopo mostrandoti anche degli esempi pratici.
Il primo metodo consiste nel posizionare il file robots.txt all'interno del tuo dominio; ad esempio http://www.jmarketing.it/robots.txt, il secondo metodo invece consiste in un'istruzione contenuta all'interno delle tue pagine web.
Il file Robots.txt
Il file robots.txt utilizza le seguenti due istruzioni:
- User-agent: qui devono essere indicati gli spider cui è rivolta l'istruzione. Ad esempio:
- User-agent: * indica che l'istruzione è diretta a tutti gli spider.
- User-agent: googlebot indica che l'istruzione è diretta al solo spider di Google.
- Disallow: indica quali cartelle non devono essere considerate dagli spider. Ad esempio:
- Disallow: /joomla/ indica allo spider non considerare l'intera directory viaggi
Un esempio di file Robots.txt potrebbe essere il seguente in cui indichiamo a Google di non considerare la directory joomla, mentre lo permettiamo agli altri motori di ricerca:
User-agent: googlebot
Disallow: /joomla/
User-agent: *
Disallow:
Al seguente indirizzo potrai trovare l'elenco completo dei nomi degli spider dei motori di ricerca: http://www.robotstxt.org/db.html
Meta Name Robot
Il Meta Name Robot è utilizzato all'interno delle pagine web ed ha la seguente sintassi:
<meta name="robots" content="index (o noindex), follow (o nofollow)">
in cui:
- index: indica allo spider di considerare la pagina.
- noindex: indica allo spider di non considerare la pagina.
- follow: indica allo spider di seguire i link contenuti nella pagina.
- nofollow: indica allo spider di non seguire i link contenuti nella pagina.
Per cui, ad esempio, l'istruzione <meta name="robots" content="index, nofollow"> indica allo spider di indicizzare la pagina ma di non seguire i link in uscita.
Terminiamo questo post con una considerazione. Entrambi i metodi sono considerati da Google, ma da non tutti i motori di ricerca, quindi ti consigliamo di fare comunque attenzione a quanto pubblicato sul tuo sito ed ai link in uscita da esso.
Se questo post ti è piaciuto ti invitiamo a lasciare un commento e se non l'hai ancora fatto, non dimenticare di iscriverti alla nostra newsletter, scaricando GRATIS il nostro special report "Crea un Blog di successo in 5 mosse!"
Aggiungi questa pagina ai tuoi siti di Social Bookmarking preferiti:





Commenti
Nelle informazioni di metadata, all'interno di ogni articolo, è presenta la voce robot... Là per fare veloce e bene che devo scrivere?
http: //www. evebo. it