Vediamo... la sitemap c'è, il file è salvato nella root del nostro sito... cosa manca?
Beh, considerando che i motori di ricerca non possono indovinare con la palla di cristallo se il nostro sito dispone o meno di una sitemap, dovremo provvedere noi a segnalarglielo!
Esistono 3 modi per segnalare una sitemap, o una sitemap index, ad un motore di ricerca:
-
Submission
-
Ping
-
Robots.txt
Submission
Fino all'invenzione della sitemap con il termine submission si usava indicare la segnalazione manuale del sito eseguita dal webmaster al motore di ricerca.
Sebbene questa possibilità esista ancora, non è certamente la soluzione più adeguata per motivi di tempo e risultato.
Ad oggi è più conveniente, per i motori di ricerca che lo supportano, eseguire la submission di una sitemap o una sitemap index poiché consente, in un colpo solo, di comunicare tutte le URL del sito e non solo la homepage o qualche sottopagina.
Per eseguire la submission alcuni motori di ricerca mettono a disposizione un pannello di controllo speciale. Al momento solo Google, Yahoo! e Microsoft permettono questo servizio rispettivamente via Google Webmaster Tools, Yahoo! Site Explorer e Microsoft Webmaster Center.
Google Webmaster Tools
Google Webmaster Tools è nato come pannello di controllo sitemap per poi evolversi in un vero e proprio centro di controllo per il webmaster con strumenti e configurazioni utili.
è possibile aggiungere all'elenco tutti i siti che si desidera gestire, ammesso di avere le autorizzazioni per gestirli, ed associare a ciascun sito la sitemap corrispondente.
Una volta inserito il sito selezionando la voce Add è possibile aggiungere una sitemap scegliendo tra le opzioni a disposizione. Verrà chiesto di inserire l'URL della sitemap, o della sitemap index, e di verificarne l'autorizzazione alla gestione attraverso una procedura guidata.
Una volta inserita la sitemap sarà necessario attendere qualche ora, anche un giorno, prima che Google la analizzi e cominci a fornire informazioni aggiuntive sullo status del file e del sito associato.
Dal pannello è possibile consultare eventuali errori individuati nel file dal crawler di Google.
Yahoo! Site Explorer
Qualche anno più tardi rispetto a Google anche Yahoo! ha messo a disposizione un pannello di controllo, meno evoluto ma ugualmente utile. Come per Google, è possibile inserire siti, associare delle sitemap o sitemap index e validarne il contenuto.
Microsoft
Nel tardo 2007 Microsoft ha finalmente rilasciato, inizialmente in una fase di beta ristretta, il proprio pannello di controllo per webmaster chiamato Webmaster Center.
In linea generale il principio è lo stesso di Google e Yahoo!. Nel pannello è possibile indicare un sito e, in seguito ad una validazione, segnalare una sitemap. Purtroppo il sistema è poco intuitivo, inusabile e confusionario.
Segnalata la sitemap non c'è modo di sapere lo status di lettura, tanto meno avere una lista delle sitemap già segnalate in precedenza per lo stesso sito. In altre parole, non è altro che una versione web based dell'interfaccia di ping a disposizione.
Ping
I blogger senz'altro avranno sentito questo termine centinaia di volte.
Per chi fosse a digiuno dell'argomento, un ping è sostanzialmente un avviso. In poche parole, un altro modo per segnalare ai motori di ricerca la presenza del file è avvisarli attraverso una apposita interfaccia messa a disposizione.
Attualmente solo 3 motori di ricerca offrono un URL da utilizzare per il ping:
Ask, all'indirizzo:
http://submissions.ask.com/ping?sitemap=LINK_SITEMAP
Google, all'indirizzo:
http://www.google.com/webmasters/sitemaps/ping?sitemap=LINK_SITEMAP
Yahoo, all'indirizzo:
http://search.yahooapis.com/SiteExplorerService/V1/updateNotification?appid=YahooDemo&url=LINK_SITEMAP
Sostituite LINK_SITEMAP
con il percorso completo della vostra sitemap prima di richiamare l'indirizzo nel browser.
Robots.txt
Aprile 2007 ha rappresentato un passo importante per quanto riguarda l'evoluzione del formato Sitemap: di comune accordo, i principali motori di ricerca hanno deciso di supportare l'autodiscovery di sitemap e sitemap index via robots.txt. Questo significa che è sufficiente inserire nel vostro file robots.txt nella root del sito la seguente stringa:
Sitemap: http://www.example.org/indirizzo/completo/sitemap.xml
contenente l'indirizzo della vostra sitemap o sitemap index per comunicare la presenta di uno o più file all'interno del vostro sito. Poiché ogni motore di ricerca interroga il file robots.txt periodicamente, in questo modo non sarà necessario eseguire richieste manuali di submission o ping.
Quale scegliere?
Fermo restando che tutte e tre le soluzioni portano allo stesso risultato, in pratica, per esperienza personale uso una soluzione mista: robots.txt + submission.
Innanzitutto inserisco l'URL della sitemap o sitemap index nel file robots.txt affinché tutti i crawler lo abbiano a disposizione. Successivamente, dove possibile, segnalo l'URL manualmente via pannello di controllo poiché mi permette di tenere sotto osservazione la validità del file ed intervenire nel caso si presentino anomalie.