Analisi sul fenomeno di pedofilo.com e vatican.va: Google ed il vaticano hanno peccato nella canonizzazione dei domini?

E' passato un po' di tempo da quando ho scritto questo articolo.
Il mondo del digital è sempre in evoluzione e potresti trovare delle informazioni non più aggiornate.

Il 17 luglio si è fatto un gran parlare del caso di vatican.va che ha subito uno scherzetto Black Hat da parte di un simpatico SEO messicano.
In pratica il risultato dell'azione ha portato il dominio “pedofilo.com” in testa ai risultati di Google per chiavi ricerca importanti quali vatican, vaticano, ecc. sia su google.it, che sulle versioni internazionali del motore di ricerca.

pedofilo.com prima del sito vatican.va

Molti giornali hanno citato il fatto dicendo che la causa del fenomeno era da ricondursi ad attacchi Hacker, di Google Bombing, di bug/glitch di Google, e chi più ne ha più ne metta:

 

In realtà a prima vista, al di là dello stupore per la forza dell'azione, sono rimasto un po' perplesso per come i media hanno descritto il fenomeno: il Google Bombing a detta degli ingegneri di Google è stato sistemato, quindi potrebbe anche non trattarsi di un problema di questo tipo. (o non solo di questo)

Qualcun altro in rete ha manifestato qualche dubbio, ad esempio Giacomo Pelagatti su Twitter, il blog "L'interno dell'agnello", il forum GT, Taller SEO (from Spain),

Per far sì che si tratti di Google Bombing è necessario che si abbia a disposizione un numero elevatissimo di risorse che linkino una pagina con degli specifici termini, come nel caso di miserable failure per George Bush, merda per italia.it, ecc.

In questo caso, però mi pare che il problema sia diverso, le attività di Google Bombing solitamente servono per associare un dominio noto ed affermato a temi diversi dal normale: in poche parole molti link con la parola “merda” portano Google a pensare che il portale turistico italia.it, sia associato non a temi turistici, ma a deiezioni umane.

Il risultato di questa azione, invece, è stato sostituire una pagina storicamente rilevante per un termine con un'altra pagina. Quindi che l'home page di pedofilo.com fosse ritenuta più rilevante dell'home page di www.vatican.va per parole chiave tipo vaticano, vatican, ecc.

Come è possibile che sia avvenuto tutto ciò? Facciamo un po' di chiarezza per quanto possibile...Prima di tutto escludiamo fenomeni di hacking subiti dal Vaticano, in quanto non sono dimostrabili.

1) il sito pedofilo.com conteneva una copia del sito vatican.va (o parte di esso)

Partiamo da una premessa, il dominio pedofilo.com che ora redirige al dominio dell'agenzia che ha svolto quest'attività, possedeva moltissimi contenuti clonati del dominio vatican.va. Non è possibile parlare di sito clone integralmente poiché non è più verificabile tale ipotesi.

Ecco la situazione dell'archivio di Google con il comando site:

Immagine 5

In sostanza pare che il sito del vaticano sia stato clonato copiando nel dominio pedofilo.com i documenti e sostituendo tutte le occorrenze del testo www.vatican.va presenti in pagina con quelle del dominio www.pedofilo.com.

Eccone qui un esempio (notare i link in basso dei due documenti):

Documento clonato di pedofilo.com con link riscritti

Documento clonato di vatican.va con link originali

2) il sito del Vaticano ha una miriade di contenuti/domini duplicati e un ottimizzazione SEO scadente

Questa copia però non giustifica il fenomeno in quanto il sito della Santa Sede è da sempre fonte di attacchi di hacker e che ha uno svariato numero di domini che copiano-riportano integralmente dei contenuti.

Ecco alcuni esempi di siti reperiti che non sembrano molto trusted a prima vista... :-)

  • http://www.0100101110101101.org/home/vaticano.org/spoof/index.html
  • http://www.jesus.2000.years.de/
  • http://ev6.org
  • http://lgrd.info

Parrebbe inoltre che gli ultimi due siano associati all'IP della Santa Sede attraverso DNS.

Inoltre anche la Santa Sede ci mette del suo con un numero sterminato di domini da loro in possesso che contengono gli stessi contenuti:

  • http://www.vatican.edu/
  • http://www.va
  • http://benedictumxvi.va/
  • http://www.vatican.net/
  • http://benedettoxvi.va/

Ed una gestione degli errori 404 con un 302 verso l'homepage ed una pessima struttura del sito per i motori di ricerca (e per gli utenti :-) )

3) Google sembra aver fatto un po' di confusione con le diverse copie dei domini

Nelle copie cache, ho notato una piccola stranezza che non so quanto possa essere utile a trarre conclusioni.
Il dominio di riferimento della copia cache dei documenti di pedofilo.com è spesso diverso:  non solo pedofilo.com o quello “canonico” (passatemi la battuta) vatican.va .

Ecco una copia cache di pedofilo.com con il dominio corretto:


Qui una copia riferita però al dominio www.vatican.va:

Qui un'altra riferita a www.va:

Copia cache associata a www.va

Qui una riferita a www.vatican.edu:

Qui una riferita a http://www.jesus.2000.years.de/:

Ed infine una riferita a www.lgrd.info:

In alcuni casi, ricercando dei documenti si può notare come Google restituisca i risultati dei domini “clonati” ma non del sito principale.

Google mostra i risultati duplicati ma non quelli originali

Insomma pare che Google, per qualche ragione, abbia delle difficoltà a capire qual'è il dominio che “comanda” ovvero potrebbe essere afflitto da gravi problemi di canonizzazione dei documenti.

Aggiungo inoltre che Google sembra quasi associare il dominio vatican.va ai testi dei nomi dei domini duplicati “pedofilo.com”, "lgrd.info", “vatican.edu”, ecc.

4) Conclusioni

Da una prima analisi, quindi, il motivo principale di questo inconveniente pare da ricondursi maggiormente a problemi di canonizzazione dei domini più che a fenomeni di Google Bombing. Facilitati in prima istanza dalla scarsissima ottimizzazione Seo del sito del Vaticano e alla presenza di moltissimi contenuti duplicati.
Tuttavia alcuni pezzettini di questo bizzarro episodio restano parzialmente fumosi. Allo scenario potremmo anche aggiungere la possibilità che possano essere avvenuti fenomeni di "intrusione" nei sistemi del Vaticano come:

  • intrusione nel DNS che gestisce il puntamento dei domini del vaticano;
  • un temporaneo redirect dal dominio vatican.va verso il sito pedofilo.com;
  • una fraudolenta validazione del Google Webmaster Tool del dominio vatican.va.

Si tratta di ipotesi da non escludere, purtroppo però non più verificabili e difficilmente lo verremo a scoprire. Quindi non mi va di gridare al lupo al lupo. :-)

Voi che cosa ne pensate in merito? Vi trovate d'accordo su alcuni punti della mia analisi?Avete qualcosa da aggiungere?

Altri post che potrebbero interessarti: