In questi giorni vi è stato un importante update nell’algoritmo di ranking di Google, che ha scombinato le logiche di diverse pagine dei risultati e che in molti hanno scambiato per l’arrivo di Google Panda.
Durante gli ultimi giorni questa novità ha destato clamore nella comunità SEO: Davide Pozzi nel suo blog con il post Google Panda 2.2 attivo anche in Italia avverte della novità, Enrico Altavilla la vede lunga dicendo che Panda non c’entra un fico secco e i webmaster del forum GT si scambiano le prime avvisaglie.
Anche altri esimi colleghi delle rete mi hanno contattato personalmente descrivendo in sostanza un pattern di siti web comuni colpiti dall’update.
Il mitico Piersante Paneghel per primo dal suo tweet tenta di dare una prima descrizione della struttura dei siti web colpiti:
…per ora mi pare che il pattern colpito sia: IF same-owner AND dupe-site THEN both-site drop traffic. No Panda
Caso dopo caso le caratteristiche della penalizzazione e del pattern dei siti colpiti sembra farsi un po’ più chiara e potrebbe essere riassunta con le seguenti caratteristiche:
| Keyword interessate: |
keyword di long tail, generalmente composte da 2 o più termini; |
| Cali riscontrati nella long tail: |
chiaramente dipende dalla dimensione del sito, generalmente siti di grandi dimensioni hanno cali più importanti poichè è maggiore il numero di pagine colpite. Sono stati registrati cali dal 20 al 60%. |
| Caratteristiche dei contenuti del sito: |
Tipicamente si tratta di siti web con contenuti duplicati o “abstract” di contenuti duplicati. L’origine dei contenuti duplicati può essere sia interna, ovvero se sono riprese informazioni dello stesso sito che esterna, ovvero la copia anche parziale i contenuti di altri siti. Le pagine “copiate” hanno sempre maggiore trust delle copie: in più di qualche caso sono notizie di quotidiani online ripresi da aggregatori. |
| Tipologia di pagine duplicate: |
Sono state colpite sia pagine foglia, ad esempio un post di un blog copiato o schede prodotto duplicate di e-commerce, che pagine di navigazione, ad esempio delle pagine hub di accesso ad altre pagine. Le pagine sono sempre contraddistinte da una forte ottimizzazione SEO dei meta tag on page: con title, description ben mirate. |
| Presenza di AdSense |
non sempre i siti colpiti fanno grande uso di Adv. |
Ci sono altri casi che avete riscontrato che “sbugiardiano” questa prima diagnosi? Che cosa ne pensate?
Sarà poi interessante capire come uscirne!
Il 17 luglio si è fatto un gran parlare del caso di vatican.va che ha subito uno scherzetto Black Hat da parte di un simpatico SEO messicano.
In pratica il risultato dell’azione ha portato il dominio “pedofilo.com” in testa ai risultati di Google per chiavi ricerca importanti quali vatican, vaticano, ecc. sia su google.it, che sulle versioni internazionali del motore di ricerca.

Molti giornali hanno citato il fatto dicendo che la causa del fenomeno era da ricondursi ad attacchi Hacker, di Google Bombing, di bug/glitch di Google, e chi più ne ha più ne metta:
In realtà a prima vista, al di là dello stupore per la forza dell’azione, sono rimasto un po’ perplesso per come i media hanno descritto il fenomeno: il Google Bombing a detta degli ingegneri di Google è stato sistemato, quindi potrebbe anche non trattarsi di un problema di questo tipo. (o non solo di questo)
Qualcun altro in rete ha manifestato qualche dubbio, ad esempio Giacomo Pelagatti su Twitter, il blog “L’interno dell’agnello“, il forum GT, Taller SEO (from Spain),
Per far sì che si tratti di Google Bombing è necessario che si abbia a disposizione un numero elevatissimo di risorse che linkino una pagina con degli specifici termini, come nel caso di miserable failure per George Bush, merda per italia.it, ecc.
In questo caso, però mi pare che il problema sia diverso, le attività di Google Bombing solitamente servono per associare un dominio noto ed affermato a temi diversi dal normale: in poche parole molti link con la parola “merda” portano Google a pensare che il portale turistico italia.it, sia associato non a temi turistici, ma a deiezioni umane.
Il risultato di questa azione, invece, è stato sostituire una pagina storicamente rilevante per un termine con un’altra pagina. Quindi che l’home page di pedofilo.com fosse ritenuta più rilevante dell’home page di www.vatican.va per parole chiave tipo vaticano, vatican, ecc.
Come è possibile che sia avvenuto tutto ciò? Facciamo un po’ di chiarezza per quanto possibile… CONTINUA A LEGGERE IL POST »»
Molto interessante un nuovo brevetto di Google “Method for detecting link spam in hyperlinked databases“, dedicato alla lotta allo spam e ai network artificiali di link registrato il 24 Marzo 2009.
La registrazione del brevetto è volta al miglioramento delle attività di intercettazione algoritmica dello spam e in particolari di due noti fianchi parti per l’algoritmo di Google:
- la link farm: una serie di pagine che puntano tutte ad uno stesso documento al fine di aumentarne la popolarità.
- clique attack (o web ring): delle interconnessioni reciproche tra diversi documenti per forzare l’autorevolezza, l’importanza ed il trust delle pagine stesse. CONTINUA A LEGGERE IL POST »»
Dopo un po’ di tempo faccio ritorno sul mio blog per segnalarvi la pubblicazione di un nuovo post nel blog aziendale di TSW, dove affronto alcune tematiche relative ad un caso di penalizzazione su Google particolare e alla risoluzione del caso.
La causa della penalizzazione, infatti, non era dovuto alla palese rottura delle linee guida di Google. Piuttosto era causata da una progettazione che teneva poco conto della struttura sematica delle pagine e del numero di contenuti in pagina.
Voi che ne pensate sul questo caso di penalizzazioni?
Buona lettura.