Update dell’algoritmo di Google per la pulizia della long tail

June 24th, 2011 § 10 comments

In questi giorni vi è stato un importante update nell’algoritmo di ranking di Google, che ha scombinato le logiche di diverse pagine dei risultati e che in molti hanno scambiato per l’arrivo di Google Panda.

Durante gli ultimi giorni questa novità ha destato clamore nella comunità SEO: Davide Pozzi nel suo blog con il post Google Panda 2.2 attivo anche in Italia avverte della novità, Enrico Altavilla la vede lunga dicendo che Panda non c’entra un fico secco e i webmaster del forum GT si scambiano le prime avvisaglie.

Anche altri esimi colleghi delle rete mi hanno contattato personalmente descrivendo in sostanza un pattern di siti web comuni colpiti dall’update.

Il mitico Piersante Paneghel per primo dal suo tweet tenta di dare una prima descrizione della struttura dei siti web colpiti:

…per ora mi pare che il pattern colpito sia: IF same-owner AND dupe-site THEN both-site drop traffic. No Panda

Caso dopo caso le caratteristiche della penalizzazione e del pattern dei siti colpiti sembra farsi un po’ più chiara e potrebbe essere riassunta con le seguenti caratteristiche:

Keyword interessate: keyword di long tail, generalmente composte da 2 o più termini;
Cali riscontrati nella long tail: chiaramente dipende dalla dimensione del sito, generalmente siti di grandi dimensioni hanno cali più importanti poichè è maggiore il numero di pagine colpite. Sono stati registrati cali dal 20 al 60%.
Caratteristiche dei contenuti del sito: Tipicamente si tratta di siti web con contenuti duplicati o “abstract” di contenuti duplicati. L’origine dei contenuti duplicati può essere sia interna, ovvero se sono riprese informazioni dello stesso sito che esterna, ovvero la copia anche parziale i contenuti di altri siti. Le pagine “copiate” hanno sempre maggiore trust delle copie: in più di qualche caso sono notizie di quotidiani online ripresi da aggregatori.
Tipologia di pagine duplicate: Sono state colpite sia pagine foglia, ad esempio un post di un blog copiato o schede prodotto duplicate di e-commerce, che pagine di navigazione, ad esempio delle pagine hub di accesso ad altre pagine. Le pagine sono sempre contraddistinte da una forte ottimizzazione SEO dei meta tag on page: con title, description ben mirate.
Presenza di AdSense non sempre i siti colpiti fanno grande uso di Adv.

Ci sono altri casi che avete riscontrato che “sbugiardiano” questa prima diagnosi? Che cosa ne pensate?

Sarà poi interessante capire come uscirne! :-P

Link building per drogare le SERP: Google in crisi tampona con interventi manuali

March 30th, 2011 § 48 comments

Riprendo dopo un po’ di inattività a scrivere sul mio blog per analizzare un caso che evidenzia in modo lampante come l’algoritmo di Google sia ancora un po’ troppo ingenuo nell’interpretazione del trust dei siti web.

Ma come può succedere, Google non è l’infallibile leader incontrastato del Search?

1- La qualità dei risultati di Google non è infallibile: il caso JCPenney

Leggendo le ultime notizie più ecclatanti sul fronte della “qualità” dei risultati emerge che Google sembra aver perso lo smalto di un tempo, come sottolinea in modo molto deciso TechCruch con il titolo  “Search Still sucks” e con questo passaggio con qualche riferimento al passato e ad AltaVista:

“For someone who’d been using AltaVista for years before that it was a very pleasant experience. Anyone who was on the Internet before Google came along knows exactly what I’m talking about. Google just felt right. It got the job done.
It’s been a creeping feeling, growing over the years, but it sort of feels like pre-Google again. Search is a really bad overall experience.”

Tra gli altri anche il New York Times pubblica un articolo/denuncia parlando del sito di JCPenney, posizionato in modo egregio per un numero di parole chiave anche molto diverse tra loro.

La ragione del posizionamento eccelso?

Un’azione di link building di “bassa” lega riassunta in queste parole:

2,015 pages with phrases like “casual dresses,” “evening dresses,” “little black dress” or “cocktail dress.” Click on any of these phrases on any of these 2,015 pages, and you are bounced directly to the main page for dresses on JCPenney.com.
Some of the 2,015 pages are on sites related, at least nominally, to clothing. But most are not. The phrase “black dresses” and a Penney link were tacked to the bottom of a site called nuclear.engineeringaddict.com. “Evening dresses” appeared on a site calledcasino-focus.com. “Cocktail dresses” showed up on bulgariapropertyportal.com. ”Casual dresses” was on a site called elistofbanks.com. “Semi-formal dresses” was pasted, rather incongruously, on usclettermen.org.

2. Un esempio anche in Italia nel settore dei prestiti

Credo che abbiamo tutti avuto modo di osservare, infatti, come anche nel mercato italiano si posizionano siti meno “autorevoli” che “drogano” la loro autorevolezza grazie ad una lauta semina in rete di link “finti”, “non spontanei” o “forzati”.

Vorrei analizzare a titolo esemplificativo un sito appena sparito dalle SERP, che io ed il mio collega Davide abbiamo mantenuto come osservato speciale.

Prestitipersonaliok.net che si posizionava fino a ieri  (29/3/2011) in modo egregio per la parola chiave competitiva “prestiti personali”.

Ora invece è (giustamente) sparito dalle SERP per un intervento manuale del buon Google…

CONTINUA A LEGGERE IL POST »»

Analisi sul fenomeno di pedofilo.com e vatican.va: Google ed il vaticano hanno peccato nella canonizzazione dei domini?

July 25th, 2010 § 21 comments

Il 17 luglio si è fatto un gran parlare del caso di vatican.va che ha subito uno scherzetto Black Hat da parte di un simpatico SEO messicano.
In pratica il risultato dell’azione ha portato il dominio “pedofilo.com” in testa ai risultati di Google per chiavi ricerca importanti quali vatican, vaticano, ecc. sia su google.it, che sulle versioni internazionali del motore di ricerca.

pedofilo.com prima del sito vatican.va

Molti giornali hanno citato il fatto dicendo che la causa del fenomeno era da ricondursi ad attacchi Hacker, di Google Bombing, di bug/glitch di Google, e chi più ne ha più ne metta:

In realtà a prima vista, al di là dello stupore per la forza dell’azione, sono rimasto un po’ perplesso per come i media hanno descritto il fenomeno: il Google Bombing a detta degli ingegneri di Google è stato sistemato, quindi potrebbe anche non trattarsi di un problema di questo tipo. (o non solo di questo)

Qualcun altro in rete ha manifestato qualche dubbio, ad esempio Giacomo Pelagatti su Twitter, il blog “L’interno dell’agnello“, il forum GT, Taller SEO (from Spain),

Per far sì che si tratti di Google Bombing è necessario che si abbia a disposizione un numero elevatissimo di risorse che linkino una pagina con degli specifici termini, come nel caso di miserable failure per George Bush, merda per italia.it, ecc.

In questo caso, però mi pare che il problema sia diverso, le attività di Google Bombing solitamente servono per associare un dominio noto ed affermato a temi diversi dal normale: in poche parole molti link con la parola “merda” portano Google a pensare che il portale turistico italia.it, sia associato non a temi turistici, ma a deiezioni umane.

Il risultato di questa azione, invece, è stato sostituire una pagina storicamente rilevante per un termine con un’altra pagina. Quindi che l’home page di pedofilo.com fosse ritenuta più rilevante dell’home page di www.vatican.va per parole chiave tipo vaticano, vatican, ecc.

Come è possibile che sia avvenuto tutto ciò? Facciamo un po’ di chiarezza per quanto possibile… CONTINUA A LEGGERE IL POST »»

Lo spam e Google: nuovo brevetto contro spam, link farm e web ring.

April 2nd, 2009 § 6 comments

Molto interessante un nuovo brevetto di Google “Method for detecting link spam in hyperlinked databases“, dedicato alla lotta allo spam e ai network artificiali di link registrato il 24 Marzo 2009.

La registrazione del brevetto è volta al miglioramento delle attività di intercettazione algoritmica dello spam e in particolari di due noti fianchi parti per l’algoritmo di Google:

  • la link farm: una serie di pagine che puntano tutte ad uno stesso documento al fine di aumentarne la popolarità.
  • clique attack (o web ring): delle interconnessioni reciproche tra diversi documenti per forzare l’autorevolezza, l’importanza ed il trust delle pagine stesse. CONTINUA A LEGGERE IL POST »»

Caso di penalizzazione su Google: post sul blog TSW

March 14th, 2009 § 4 comments

Dopo un po’ di tempo faccio ritorno sul mio blog per segnalarvi la pubblicazione di un nuovo post nel blog aziendale di TSW, dove affronto alcune tematiche relative ad un caso di penalizzazione su Google particolare e alla risoluzione del caso.

La causa della penalizzazione, infatti, non era dovuto alla palese rottura delle linee guida di Google. Piuttosto era causata da una progettazione che teneva poco conto della struttura sematica delle pagine e del numero di contenuti in pagina.

Voi che ne pensate sul questo caso di penalizzazioni?

Buona lettura.

Where Am I?

You are currently browsing the Penalizzazioni e spam category at Andrea Vit.