Il formato Sitemap, così come lo conosciamo oggi è (appunto) un formato basato sul formato XML.
Quello che rende questo formato molto speciale, soprattutto per quanti lavorano nel campo dei motori di ricerca, è la sua origine e la sua utilità.
A cosa serve una Sitemap?
Vi trovate catapultati in una grande città come Roma.
È la prima volta che approdate nella capitale, ci arrivate grazie alla segnalazione di un vostro amico che vi ha consigliato di visitarla ma, appena scesi alla stazione Termini, davanti a voi si aprono decine di strade. Il vostro tempo è limitato. Da che parte andare? Quali strade scegliere? È meglio proseguire diritto oppure prendere una traversa? Quale strada sarà più interessante? La città è grande: e se non riuscissi a visitarla tutta?
Certamente sarebbe utile una mappa, una cartina della città...
Questo paragone, anche se non così raffinato, vi introduce rapidamente nel problema: il visitatore è lo spider che arriva nel vostro sito seguendo un collegamento esterno o una segnalazione.
Arriva nel vostro sito, magari già lo conosce, e si trova davanti 10, 100, 1000 link! Il suo tempo è limitato, ha milioni di altri siti da visitare quindi non può fermarsi troppo.
Quali sono le pagine da visitare prima? Quali sono quelle più importanti?
La sitemap è la sua cartina per individuare e visitare al meglio il vostro sito.
Chi conosce un sito meglio di chi lo ha creato? Probabilmente nessuno, ecco perché Google ha deciso di offrire ai webmaster uno strumento che consentisse loro di agevolare l'attività del suo crawler.
Come vedremo nella lezione seguente, il formato Sitemap è stato introdotto da Google per consentire ai webmaster di fornire al motore di ricerca una lista delle URL che compongono un sito. Assieme all'elenco è possibile definire la priorità delle URL, la loro importanza e qualche dettaglio aggiuntivo.
Esempi pratici di Sitemap
Vediamo qualche esempio pratico di come il formato Sitemap possa aiutare voi ad ottenere risultati migliori ed il crawler a conoscere meglio il vostro sito.
Sito con navigazione JavaScript
Il vostro sito, per qualche motivo, ha un menu di navigazione completamente in JavaScript che rende impossibile ai crawler l'individuazione di qualsiasi altra pagina oltre alla homepage. Come sappiamo, infatti, i crawler volutamente non eseguono JavaScript.
Ma il vostro sito è interessante, ha centinaia di pagine! A questo punto una possibile soluzione è configurare il vostro CMS affinché generi in automatico una sitemap contenente una lista delle pagine disponibili per il vostro sito. Una volta segnalata ai motori di ricerca, i loro crawler individueranno le pagine e le indicizzeranno correttamente.
Un discorso analogo è valido nel caso di una navigazione strutturata con filmati Macromedia Flash.