Dal 12 Agosto 2011 Google ha introdotto "Panda" anche in Italia. Il nome, derivato da quello di un ingegnere di Mountain View (Navneet Panda) specializzato in algoritmi di apprendimento automatico, indica l'aggiornamento al sistema con cui Google calcola la pertinenza di una pagina alla ricerca eseguita dall'utente. Google Panda, dunque, influisce anche sulla posizione che una pagina web avrà nella pagina dei risultati (SERP, search engine result page). Google Panda, chiamato ufficialmente "aggiornamento dell'algoritmo per i siti di alta qualità", è uno dei maggiori cambiamenti che Google ha mai introdotto, in un colpo solo, al suo sistema di classificazione e ha influito profondamente sulla visibilità di un sito nell'indice di ricerca, comportando forti penalizzazioni e altrettanto forti miglioramenti.
In questo articolo vedremo in primo luogo cosa è Panda e come è nato, vedremo poi come capire se si è stati colpiti o no dalla modifica e, infine, analizzeremo alcune delle soluzioni per difendersi da questa modifica e daremo informazioni, nell'ultima pagina, su come applicarle. Alla fine dell'articolo indicheremo anche alcuni degli articoli comparsi nelle settimane precedenti che hanno contribuito a comprendere meglio questo aggiornamento.
Che cos'è Panda
Panda affonda le radici in Caffeine, la nuova architettura di ricerca che ha consentito a Google negli ultimi anni di ampliare e rendere più veloce l'indicizzazione dei contenuti. Con l'introduzione di Caffeine, Google si è trovato, sono parole del capo del team di classificazione di Google Amit Singhal, a dover fronteggiare la classificazione di un gran numero di "contenuti di scarsa qualità". Nell'ottica di Google Panda serve a premiare, nelle pagine dei risultati di ricerca, siti affidabili che forniscono contenuti di qualità: originali, ben scritti, utili e dall'alta leggibilità.
Per definire il sistema scientifico (e computazionale) che fosse in grado di distinguere automaticamente i siti di alta qualità da quelli di bassa qualità, Google ha iniziato dalle persone. Un ingegnere di Mountain View ha stilato un set di domande che sono state sottoposte ai quality raters, personale reclutato per valutare la qualità delle ricerche di Google. Il tono delle domande, probabilmente le stesse che sono state pubblicate successivamente da Google stessa, era: "Considerereste il sito una fonte autorevole nel momento in cui viene nominato?", "Vi aspettereste di trovare l'articolo in una rivista, un'enciclopedia o un libro cartacei?", "Nell'articolo ci sono troppi annunci che distolgono l'attenzione dai contenuti principali o interferiscono con essi?" e così via.
Dalle riposte a questo set di domande Google ha creato una definizione di quello che può essere considerato di bassa qualità e lo ha trasformato in algoritmi in grado di calcolarlo matematicamente. Per farlo Google utilizza i milioni di dati che ricava dal suo sito di ricerca, dalla Google toolbar e da decine di altri strumenti che ogni utente utilizza quotidianamente.
Capire come faccia è abbastanza semplice. Se, ad esempio, un utente cerca su google.it "hotel a Roma", clicca il primo risultato e poi torna subito indietro per cliccare il secondo (e non tornare), vuol dire che quel primo risultato non ha soddisfatto le sue aspettative, mentre il secondo sì. Se questo è il comportamento non di uno, ma di migliaia di utenti, Google avrà un segnale che quel primo risultato non è utile.
Come capire se si è penalizzati da Panda
L'effetto di Panda è quello di declassare alcuni siti dalla pagina dei risultati. Questo si traduce in minori impression del proprio sito nei risultati e, secondariamente, in minori accessi da Google alle proprie pagine. Per capire se si è stati penalizzati è necessario esaminare questi due effetti: se analizziamo il numero di impression eseguiremo un'analisi diretta di Google Panda; se invece analizziamo gli accessi al nostro sito eseguiremo un'analisi indiretta.
Si faccia attenzione: a detta di Google se solo alcune pagine di un sito includono i segnali ritracciati da Google Panda sarà l'intero sito ad essere penalizzato e non le singole pagine.
L'ideale per capire se il proprio sito è stato colpito da Panda è quello di analizzare, per un set di chiavi di ricerca, il numero di pagine del proprio sito presenti nelle SERP e la loro posizione. Questo andrebbe naturalmente analizzato prima e dopo il 12 Agosto, giorno dell'introduzione della modifica. Ciò è possibile solo se si è attivato, prima dell'introduzione di Panda, un sistema di monitoraggio automatico o se si possiedono dati storici della presenza di alcune chiavi su Google. In mancanza di questi dati si può ricorrere a Webmaster Tools.
Webmaster tools
Lo strumento per Webmaster di Google fornisce, al percorso Il tuo sito Web -> Query di ricerca, il numero di volte che le pagine del proprio sito sono state visualizzate nei risultati della ricerca Web. Un calo in questo grafico a partire dal 12 agosto indica, probabilmente, che il proprio sito è stato colpito da Panda.
Figura 1: Un sito che mostra, su Webmaster tools,
un calo di impression da ricerca dopo il 12 Agosto
Poiché Panda è stato introdotto il 12 Agosto, periodo in cui si potrebbe pensare ad un calo generalizzato degli accessi, è buona norma anche confrontare le performance specifiche di alcune chiavi di ricerca con Google Trends, sovrapponendo le performance di una chiave specifica del proprio sito con quelle globali rilevate da Google Trends.
Google Trends e Webmaster tools sono naturalmente strumenti che eseguono la rilevazione dei dati non in modo specifico per sito e soffrono, soprattutto Google Trends, di normalizzazioni e arrotondamenti forse eccessivi per poter fornire una risposta univoca e indubitabile. Tuttavia, in mancanza di rilevazioni autonome, possono fornire certamente una prima indicazione.
Google Analytics
Utilizzando Google Analytics è possibile analizzare il traffico generato da Google sul proprio sito e, dunque, ottenere informazioni su come Google Panda ha influito sul traffico da Google. Le informazioni si recuperano dal rapporto Sorgenti di traffico -> Sorgenti -> Tutto il traffico -> google / organic (nella nuova versione di Analytics).
Per rendere più affidabile la ricerca sarebbe bene anche eliminare dalle parole chiave che concorrono ai risultati del report le cosiddette ricerche "branded", ossia le ricerche che utilizzano il nome del sito o della persona che lo gestisce per raggiungerlo e che non sono significative per rilevare l'effetto Panda. In figura 4 il segmento avanzato da creare in Google Analytics per escludere alcune ricerche branded.
Figura 4: Il segmento avanzato per escludere determinate parole chiave dalla ricerca organica
(clic per ingrandire)
Google Panda è molto probabile che influenzi solo il database di ricerche Web e non quello, per dire, di Google News. Dunque si faccia attenzione, durante la valutazione, a non includere nell'analisi anche gli accessi derivanti da questo sito.
Come difendersi
Google Panda aggiunge diverse altre analisi a quelle che Google già utilizza per analizzare e valutare siti web. Se dunque non si è in regola con le linee guida indicate da Google stesso nel suo sito dedicato ai Webmaster, si farebbe bene a partire da lì. Se invece si pensa che il proprio sito abbia subito una penalizzazione eccessiva, è bene cominciare a porsi le stesse domande che si sono posti gli ingegneri di Google quando hanno cominciato a stilare la lista di elementi da usare come parametro di valutazione.
Fuor di teoria, possiamo suddividere gli interventi da valutare in tre diverse categorie.
Layout della pagina e contenuti
- Alto numero di pagine simili o duplicate. Panda svaluta i siti che utilizzano un troppo alto numero di pagine duplicate o pagine che hanno contenuti o design troppo simili tra pagina e pagina. Anche l'eccesso di articoli dal contenuto simile per posizionarsi su Google con chiavi diverse potrebbero soffrire della penalizzazione.
- Percentuale troppo alta di contenuti non originali. Panda svaluta i siti che si limitano a "collezionare" contenuti dal Web per ricomporli in vario modo sulle proprie pagine. In questa categoria ricadono aggregatori o semplici "collezionatori" di link. Panda svaluta i siti che si limitano a fare da "eco" a contenuti originali pubblicati altrove.
- Presenza eccessiva di pubblicità rispetto al contenuto, soprattutto in alto nella pagina (above the fold). L'eccessiva presenza di box pubblicitari, soprattutto se inseriti all'interno della stessa area che ospita il contenuto e posizionati in alto nella pagina.
- Pagine con poco contenuto. Pagine con contenuto formato da poche linee di testo rispetto agli altri elementi.
Engagement
Panda svaluta anche quei siti che mostrano un basso valore di "coinvolgimento" per gli utenti. Per analizzare questo valore si possono utilizzare parametri presenti in quasi tutti i servizi di Web analytics.
- Percentuale di rimbalzo (bounce). Indica la percentuale degli utenti che abbandonano il sito dopo aver visto una sola pagina. Una bassa percentuale di rimbalzo contribuisce a migliorare la valutazione di Google.
- Tempo sul sito. Indica il tempo che un utente rimane sulle pagine del sito. Una maggiore permanenza dell'utente contribuisce a migliorare la valutazione di Google.
- Percentuale di utenti di ritorno. Indica il numero di utenti che tornano spesso sulle pagine del proprio sito anche a distanza di tempo. Una maggiore percentuale di utenti di ritorno contribuisce a migliorare la valutazione di Google.
Il miglioramento di questi parametri non è banale: si tratta di migliorare in profondità l'esperienza di un utente: dalla qualità dei contenuti, al design del sito, alla presenza di elementi che distolgono la loro attenzione e così via.
Awareness
Google Panda valuta anche la credibilità di un sito e la sua riconoscibilità (Considerereste il sito una fonte autorevole nel momento in cui viene nominato? è una delle domande che sono alla base della composizione dell'algoritmo). In questo caso è necessario mettere a punto azioni in grado di (ri)stabilire la presenza online del marchio: favorirne la visibilità, renderne percepibili i valori, divulgarne il nome. I social network possono essere ottimi strumenti per mettere in atto queste campagne.
Come farsi escludere
Il metodo migliore per recuperare da un'accertata penalizzazione dovuta alle modifiche dell'algoritmo è quella di migliorare le caratteristiche del proprio sito cominciando da quelle indicate alla pagina precedente. Se si desidera verificare quale delle azioni ha portato ad un miglioramento del posizionamento è consigliabile applicare le modifiche ad una ad una o, meglio, raggruppare le modifiche in gruppi dalle caratteristiche simili e rilasciarle per gruppi. Come vedremo più avanti, potrebbe passare molto tempo dal rilascio delle modifiche alla rivalutazione dell'effetto Panda. In entrambi i casi è bene comunque definire preventivamente una metodologia di analisi che permetta di verificare con certezza le variazioni.
Va anche sottolineato come Google Panda sia una modifica che parte da una valutazione "umana", ossia dal giudizio che persone in carne ed ossa hanno dato di particolari aspetti del sito che è stato loro sottoposto. Mettersi nei panni di un utente comune che esegue una ricerca sul Web, navigare il proprio sito ponendosi le domande pubblicate da Google e darsi risposte sincere potrebbe sicuramente far emergere i punti di debolezza delle proprie pagine.
Da una delle risposte di Matt Cutts, che dirige il web spam team di Google, alla SMX Advanced conference sembra che gli effetti di Panda sia calcolato su ogni sito ad ogni iterazione dell'algoritmo (ma ci sono anche altri segnali che le riconsiderazioni siano eseguite automaticamente a intervalli minori). Ciò significa che se vengono prese delle contromisure per bilanciare gli effetti dell'algoritmo si dovrà attendere un nuovo aggiornamento per verificare la loro efficacia. Ad oggi le iterazioni sono state le seguenti: 12 Agosto (Panda 2.4), 23 Luglio (Panda 2.3 ), 16 Giugno (Panda 2.2 ), 10 Maggio (Panda 2.1), 11 Aprile (Panda 2.0) e 24 Febbraio (Panda 1.0), con un tempo minimo di recupero fissato dunque a 3 settimane.
Il team di Google Italia ha inoltre messo a disposizione un modulo che permette di segnalare eventuali incongruenze nelle ricerche dopo l'introduzione di Panda.
Link utili
Per la stesura di questo articolo sono stati particolarmente utili i seguenti contenuti:
- TED 2011: The 'Panda' That Hates Farms: A Q&A With Google's Top Search Engineers
- The Farmer/Panda Update: New Information From Google
- How Google's Panda Update Changed SEO Best Practices Forever
- Beating Google's Panda Update - 5 Deadly Content Sins
- SMX Advanced Liveblog: 'You & A' Keynote With Google's Matt Cutts
- Google Italia: Altre indicazioni per la realizzazione di siti di alta qualità
- Absolutely Everything You Need to Know About the Google Panda Update